May 2009 - May 2017 论坛八周年-你的足迹,我的骄傲


一亩三分地论坛

 找回密码
 获取更多干活,快来注册

一亩三分地官方iOS手机应用下载
查看: 4270|回复: 16
收起左侧

Google 电面二进宫

[复制链接] |试试Instant~ |关注本帖
andr_ 发表于 2015-7-23 13:32:05 | 显示全部楼层 |阅读模式

2015(7-9月) 码农类 硕士 全职@Google - Other - 技术电面 |Passfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
上周三电面了一次,题目是recurring decimal,边界条件考虑得不是太好,所以给了个二面的机会。这次比较顺利早上面完下午就收到cong了
这次出了一个byte encoding的题目,大概是给你一种编码的格式,然后给你一个byte数组,让你判断这个数组合不合法
这个编码的定义是,有1-7byte的character,每种character第一个byte有一个固定的前缀,比如1 byte character第一个byte的前缀是0,2 byte是110, 3 byte 是1110以此类推, 8byte是11111111。. more info on 1point3acres.com
有一个特殊的前缀是10,这种byte是每个多byte character的组成部分。比如一个2 byte character: 110XXXXX 10XXXXXX。一个3 byte character: 1110xxxx 10xxxxxx 10xxxxxx。
如果字符被打段或者超长都要fail。
算法很简单,实现起来还是有些细节要注意。这题之前面经没看到过,就发出来给大家留个参考。. visit 1point3acres.com for more.

评分

3

查看全部评分

hulahu 发表于 2015-7-23 14:29:58 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
楼主, 能不能具体说说recurring decimal? 是小数点后重复?leetcode 原题?
回复 支持 反对

使用道具 举报

hulahu 发表于 2015-7-23 15:01:04 | 显示全部楼层
关注一亩三分地微博:
Warald
比如一个2 byte character: 110XXXXX 10XXXXXX。-->这个是invalid? 一个3 byte character: 1110xxxx 10xxxxxx 10xxxxxx 这也是invalid?

可不可给几个例子, valid and invalid
回复 支持 反对

使用道具 举报

xiaotdl 发表于 2015-7-23 16:01:59 | 显示全部楼层
这是validate unicode编码么
回复 支持 反对

使用道具 举报

wangyiduo999 发表于 2015-7-23 16:13:42 | 显示全部楼层
xiaotdl 发表于 2015-7-23 16:01. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
这是validate unicode编码么

应该是验证unicode
回复 支持 反对

使用道具 举报

hehe_makeit 发表于 2015-7-23 19:52:25 | 显示全部楼层
求问楼主,整个byte array只能代表一个character 还是 多个character 呢
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-23 22:53:05 | 显示全部楼层
hulahu 发表于 2015-7-23 15:01
比如一个2 byte character: 110XXXXX 10XXXXXX。-->这个是invalid? 一个3 byte character: 1110xxxx 10xxx ...

我给的这两个都是valid的,几byte是从带前缀那个byte开始数的。10XXXXXX说明是在一个n(n>1)byte 字符里,而且不是那个字符的第一个byte
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-23 22:53:45 | 显示全部楼层
hehe_makeit 发表于 2015-7-23 19:52
求问楼主,整个byte array只能代表一个character 还是 多个character 呢

多个字符,这样才有意义嘛是吧!
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-23 22:54:38 | 显示全部楼层
wangyiduo999 发表于 2015-7-23 16:13. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
应该是验证unicode

嗯没错就是unicode...惭愧啊面完了还不知道这到底是什么东西
回复 支持 反对

使用道具 举报

jasusy 发表于 2015-7-24 03:39:24 来自手机 | 显示全部楼层
谢lz,那input character是以什么形式输入的?
回复 支持 反对

使用道具 举报

jiebour 发表于 2015-7-24 04:01:49 | 显示全部楼层
这个题类似判断utf-8编码是否正确。输入也是一个byte数组。。。。国内Google面试过这道题。。。
回复 支持 反对

使用道具 举报

rogerdai 发表于 2015-7-24 04:12:05 | 显示全部楼层
validate utf-8吧,palantir也会面这题
回复 支持 反对

使用道具 举报

say543 发表于 2015-7-24 10:37:17 | 显示全部楼层
就是UTf-8 verify
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-27 00:15:09 | 显示全部楼层
jasusy 发表于 2015-7-24 03:39
谢lz,那input character是以什么形式输入的?

我用python,所以就是Byte[]
回复 支持 反对

使用道具 举报

hj867955629 发表于 2015-8-28 12:12:58 | 显示全部楼层
就是给你的是编码好的byte数组,然后根据byte长度来确定前缀是否正确?
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-8-29 22:57:57 | 显示全部楼层
hj867955629 发表于 2015-8-28 12:12
就是给你的是编码好的byte数组,然后根据byte长度来确定前缀是否正确?

不只是长度,还要考虑合法性
回复 支持 反对

使用道具 举报

alucardzhou 发表于 2015-8-30 04:14:08 | 显示全部楼层
https://en.wikipedia.org/wiki/UTF-8#Description
详细说明UTF-8
附一个明了的解法
http://codereview.stackexchange.com/questions/59428/validating-utf-8-byte-array
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2017-5-24 21:55

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表