《数据科学面试40+真题讲解》,K神本年度最后一次开课


一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推你去多家公司面试
Airbnb 数据科学职位
in analytics and inference
天天打游戏、照样领工资,
你要不要来?
把贵司招聘信息放这里
查看: 1078|回复: 3
收起左侧

Amazon新鲜电面

[复制链接] |试试Instant~ |关注本帖
wlwallis 发表于 2016-9-28 14:10:39 | 显示全部楼层 |阅读模式

2016(7-9月) 码农类 硕士 全职@Amazon - 猎头 - 技术电面 |Pass在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
先问了这几年做了什么东西,约20分钟,然后online coding出了一道medium or hard的题目,leetcode上没有。. Waral 鍗氬鏈夋洿澶氭枃绔,
given a matrix, each row is an array of integers, find the K sets of rows which has the best cosine similarity.
cosine similarity:
similarity = (x1*y1+x2*y2...)/(sqrt(x1*x1+x2*x2...)*(sqrt(y1*y1+y2*y2...)))

这道题实际上是machine learning里面的KNN的变种,面试官叙述上过于简洁,我反复沟通后才明白实际上是求 K sets of "closest" rows for each row.
用Heap就好。
mymax2009 发表于 2016-9-29 07:10:58 | 显示全部楼层
你的简历是有machine learning的项目吗?
回复 支持 反对

使用道具 举报

mymax2009 发表于 2016-9-29 07:14:08 | 显示全部楼层
楼主能举个例子吗? 这题感觉没完全明白, 是要找K 个连续的row吗? 还是找对于每个row来说similarity最接近的K个row?  
回复 支持 反对

使用道具 举报

liurudahai 发表于 2016-10-9 08:57:17 | 显示全部楼层
每一行用公式算出来之后扔到HEAP里?
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-11-22 22:55

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表