《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 2878|回复: 13
收起左侧

IN onsite

[复制链接] |试试Instant~ |关注本帖
lea82 发表于 2016-6-2 02:57:33 | 显示全部楼层 |阅读模式

2016(4-6月) 码农类 硕士 全职@Linkedin - 内推 - Onsite |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
Design a service system to recommend the top 100 articles that got shared the most in the last 5mins, in the last 1 hour, in the last 24 hours.
Any suggestions?

the other coding questions are Leetcode medium, hard questions.


评分

1

查看全部评分

laonong15 发表于 2016-6-3 22:19:28 | 显示全部楼层
1.Lets say we  need  the function  interface like :

List<Articles> getTopHundreadsByPeirod( time  interval). from: 1point3acres.com/bbs
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
2.  discuss the   constraint :  
    how many  articles  per day, hour / mintues. visit 1point3acres.com for more.
    how many users    online  same times
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴3.   if  the data is not  really big   
      use  hash and  heap  to implement    also  it will be   on server with one back up  , also you can do  sharding   write to   master  and read from  slave servers.鏈枃鍘熷垱鑷1point3acres璁哄潧
      we also  can discuss  cache  and distributed hash here.1point3acres缃
4, if the  data is big    and  we want to  live streaming   specially  the article from different  resources so . more info on 1point3acres.com
     use kafka   and storm  , here we can discuss  about  producer  consumer       message broker .... and storm  spout and bolt   
回复 支持 1 反对 0

使用道具 举报

jiebour 发表于 2016-6-2 03:26:08 | 显示全部楼层
IN 是哪个公司。。。。
回复 支持 反对

使用道具 举报

mdyuki1016 发表于 2016-6-2 05:18:15 | 显示全部楼层
楼主能分享下其他算法题吗,马上就要onsite
回复 支持 反对

使用道具 举报

 楼主| lea82 发表于 2016-6-2 05:50:51 | 显示全部楼层
mdyuki1016 发表于 2016-6-2 05:18
楼主能分享下其他算法题吗,马上就要onsite

edit distance,
kind of the find celebrity question
permutation. 1point3acres.com/bbs
回复 支持 反对

使用道具 举报

adiggo 发表于 2016-6-2 06:27:21 | 显示全部楼层
楼主 可以讲一下 那道design题 的思路么
回复 支持 反对

使用道具 举报

lookbackinanger 发表于 2016-6-2 08:12:22 | 显示全部楼层
楼主面的那个职位啊?
回复 支持 反对

使用道具 举报

 楼主| lea82 发表于 2016-6-3 00:40:44 | 显示全部楼层
how to delete my own reply?
回复 支持 反对

使用道具 举报

laonong15 发表于 2016-6-3 22:11:33 | 显示全部楼层
1.Lets say we  need  the function  interface like :

List<Articles> getTopHundreadsByPeirod( time  interval)

2.  discuss the   constraint :. 1point 3acres 璁哄潧
回复 支持 反对

使用道具 举报

readman 发表于 2016-6-3 22:50:53 | 显示全部楼层
count sketch algorithm
回复 支持 反对

使用道具 举报

adiggo 发表于 2016-6-3 23:45:15 | 显示全部楼层
laonong15 发表于 2016-6-3 22:19
1.Lets say we  need  the function  interface like : 鏉ユ簮涓浜.涓夊垎鍦拌鍧.

List getTopHundreadsByPeirod( time  interval) ...

hash 我可以理解 是记录 frequency, 但是heap 用在这里 没太大意义吧。
回复 支持 反对

使用道具 举报

adiggo 发表于 2016-6-3 23:51:04 | 显示全部楼层
readman 发表于 2016-6-3 22:50
count sketch algorithm

之前google搜出来的就是这个, 一直没认真看,涨姿势了。
回复 支持 反对

使用道具 举报

laonong15 发表于 2016-6-4 03:28:05 | 显示全部楼层
Heap for top 100
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-25 16:08

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表