一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 2888|回复: 16
收起左侧

Google 电面二进宫

[复制链接] |试试Instant~ |关注本帖
andr_ 发表于 2015-7-23 13:32:05 | 显示全部楼层 |阅读模式

2015(7-9月) 码农类 硕士 全职@Google - Other - 技术电面 |Passfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
上周三电面了一次,题目是recurring decimal,边界条件考虑得不是太好,所以给了个二面的机会。这次比较顺利早上面完下午就收到cong了
这次出了一个byte encoding的题目,大概是给你一种编码的格式,然后给你一个byte数组,让你判断这个数组合不合法
这个编码的定义是,有1-7byte的character,每种character第一个byte有一个固定的前缀,比如1 byte character第一个byte的前缀是0,2 byte是110, 3 byte 是1110以此类推, 8byte是11111111。
有一个特殊的前缀是10,这种byte是每个多byte character的组成部分。比如一个2 byte character: 110XXXXX 10XXXXXX。一个3 byte character: 1110xxxx 10xxxxxx 10xxxxxx。
如果字符被打段或者超长都要fail。. 1point3acres.com/bbs
算法很简单,实现起来还是有些细节要注意。这题之前面经没看到过,就发出来给大家留个参考。.鏈枃鍘熷垱鑷1point3acres璁哄潧
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴

评分

3

查看全部评分

hulahu 发表于 2015-7-23 14:29:58 | 显示全部楼层
楼主, 能不能具体说说recurring decimal? 是小数点后重复?leetcode 原题?
回复 支持 反对

使用道具 举报

hulahu 发表于 2015-7-23 15:01:04 | 显示全部楼层
比如一个2 byte character: 110XXXXX 10XXXXXX。-->这个是invalid? 一个3 byte character: 1110xxxx 10xxxxxx 10xxxxxx 这也是invalid?. Waral 鍗氬鏈夋洿澶氭枃绔,

可不可给几个例子, valid and invalid
回复 支持 反对

使用道具 举报

xiaotdl 发表于 2015-7-23 16:01:59 | 显示全部楼层
这是validate unicode编码么
回复 支持 反对

使用道具 举报

wangyiduo999 发表于 2015-7-23 16:13:42 | 显示全部楼层
xiaotdl 发表于 2015-7-23 16:01. visit 1point3acres.com for more.
这是validate unicode编码么

应该是验证unicode
回复 支持 反对

使用道具 举报

hehe_makeit 发表于 2015-7-23 19:52:25 | 显示全部楼层
求问楼主,整个byte array只能代表一个character 还是 多个character 呢
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-23 22:53:05 | 显示全部楼层
hulahu 发表于 2015-7-23 15:01
比如一个2 byte character: 110XXXXX 10XXXXXX。-->这个是invalid? 一个3 byte character: 1110xxxx 10xxx ...

我给的这两个都是valid的,几byte是从带前缀那个byte开始数的。10XXXXXX说明是在一个n(n>1)byte 字符里,而且不是那个字符的第一个byte
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-23 22:53:45 | 显示全部楼层
hehe_makeit 发表于 2015-7-23 19:52
求问楼主,整个byte array只能代表一个character 还是 多个character 呢

多个字符,这样才有意义嘛是吧!
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-23 22:54:38 | 显示全部楼层

嗯没错就是unicode...惭愧啊面完了还不知道这到底是什么东西
回复 支持 反对

使用道具 举报

jasusy 发表于 2015-7-24 03:39:24 来自手机 | 显示全部楼层
谢lz,那input character是以什么形式输入的?
回复 支持 反对

使用道具 举报

jiebour 发表于 2015-7-24 04:01:49 | 显示全部楼层
这个题类似判断utf-8编码是否正确。输入也是一个byte数组。。。。国内Google面试过这道题。。。
回复 支持 反对

使用道具 举报

rogerdai 发表于 2015-7-24 04:12:05 | 显示全部楼层
validate utf-8吧,palantir也会面这题
回复 支持 反对

使用道具 举报

say543 发表于 2015-7-24 10:37:17 | 显示全部楼层
就是UTf-8 verify
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-7-27 00:15:09 | 显示全部楼层
jasusy 发表于 2015-7-24 03:39
谢lz,那input character是以什么形式输入的?

我用python,所以就是Byte[]
回复 支持 反对

使用道具 举报

hj867955629 发表于 2015-8-28 12:12:58 | 显示全部楼层
就是给你的是编码好的byte数组,然后根据byte长度来确定前缀是否正确?
回复 支持 反对

使用道具 举报

 楼主| andr_ 发表于 2015-8-29 22:57:57 | 显示全部楼层
hj867955629 发表于 2015-8-28 12:12
就是给你的是编码好的byte数组,然后根据byte长度来确定前缀是否正确?

不只是长度,还要考虑合法性
回复 支持 反对

使用道具 举报

alucardzhou 发表于 2015-8-30 04:14:08 | 显示全部楼层
https://en.wikipedia.org/wiki/UTF-8#Description. more info on 1point3acres.com
详细说明UTF-8. more info on 1point3acres.com
附一个明了的解法
http://codereview.stackexchange.com/questions/59428/validating-utf-8-byte-array
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-7 22:59

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表