Mock interview for data science
仅限两天:购买DS501或者DS601,全站课程15% off

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
有你有策略
微策略(MicroStrategy)
2019校园招聘火热进行中
E轮2.5亿美元融资
K12教育独角兽一起作业诚聘
机器学习/数据统计/教育等职位
码农求职神器Triplebyte:
不用海投
内推多家公司面试
高效直聘+内推,70%面试率
AI帮你免费完善简历
直击全美十万个科技职位
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
游戏初创公司招聘工程师、UIUX Designer和游戏策划
把贵司招聘信息放这里
查看: 2003|回复: 18
收起左侧

Linkedin Data Scientist Phone Interview

[复制链接] |试试Instant~
我的人缘0
hyper8866 发表于 2018-7-12 07:15:37 | 显示全部楼层 |阅读模式
本楼: 【顶】   100% (1)
 
 
0% (0)   【踩】
全局: 顶  90% (18)
 
 
10% (2)  踩

2018(7-9月) 分析|数据科学类 硕士 全职@Linkedin - 网上海投 - 技术电面  | Other | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
Problem Statement:  Member can make purchase via either mobile  or desktop platform. Using the following data table to determine the total number of member and revenue for mobile-only, desktop_only and mobile_desktop.
The input spending table is . check 1point3acres for more.
member_id    date    channel   spend
1001    1/1/2018    mobile    100
1001    1/1/2018    desktop    100
1002    1/1/2018    mobile    100
1002    1/2/2018    mobile    100
1003    1/1/2018    desktop    100
1003    1/2/2018    desktop    100
部分内容已被隐藏,需要一亩三分地积分高于 188 才可继续浏览。
查看如何攒积分 Click here for more info.
案吧...




补充内容 (2018-7-12 12:37):
在code pad写了这么多R后。。面试官跟我说 她不会用R...能不能写一个SQL版本TAT 我于是直接一个剪切把R code都删了。现在想想 应该留着....给有缘人看@@

评分

参与人数 2大米 +6 收起 理由
asyz13jinage + 5 很有用的信息!
tzuyiyen + 1 很有用的信息!

查看全部评分


上一篇:UBS data analyst 电面面经
下一篇:Visa Data Scientist电面
我的人缘0
miaozuoyu 发表于 2018-7-12 08:46:04 | 显示全部楼层
本楼: 【顶】   100% (3)
 
 
0% (0)   【踩】
全局: 顶  100% (5)
 
 
0% (0)  踩
MySQL 答案
select date,chn,count(spend) as total_spend, count(distinct member_id)
from
(
select member_id,date,spend,
case when cnt=1 then channel
     else 'both' end as chn
from
(
select member_id,date, count(distinct channel) as cnt
from spending
group by member_id, date) as s1
inner join spending as s2
using(member_id,date)
) as t
group by date, chn
order by date
回复

使用道具 举报

我的人缘0
chipmunkL 发表于 2018-7-12 23:43:33 | 显示全部楼层
本楼: 【顶】   100% (1)
 
 
0% (0)   【踩】
全局: 顶  100% (3)
 
 
0% (0)  踩
SELECT s1.date AS date,
(CAESE WHEN COUNT(DISTINCT s2.channel) = 1 THEN s2.channel ELSE "both" END) AS channel,
(SUM(s2.spend)) AS total_spend,
(COUNT(distinct member_id) AS total_members
FROM Spending s1 LEFT JOIN Spending s2
ON s1.member_id = s2.member_id AND s1.date = s2.date
GROUP BY date
ORDER BY date;
回复

使用道具 举报

我的人缘0
cixian1110 发表于 2018-7-12 07:46:13 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (1)
 
 
0% (0)  踩
问题有一处不清楚,假如一个member在第一天买了desktop第二天买了mobile,那么有两种可能
1.两天都算both
2.第一天是desktop第二天是Mobile。

后面一种稍微难写一点点, 下面是code。如果按第一种的话同样思路稍微改改就行。

with desktop_only as
(
        select cast(member_id as varchar) || cast(date as varchar)
        from spending
        group by member_id, date. check 1point3acres for more.
        having sum(if(channel = 'mobile', 1, 0)) = 0
),
. check 1point3acres for more.mobile_only as
(
        select cast(member_id as varchar) || cast(date as varchar)
        from spending
        group by member_id, date
        having sum(if(channel = 'desktop', 1, 0)) = 0
),
both as
(
        select cast(member_id as varchar) || cast(date as varchar)
        from spending
        group by member_id, date
        having sum(if(channel = 'mobile', 1, 0)) > 0 . From 1point 3acres bbs
        and sum(if(channel = 'mobile', 1, 0)) > 0
)
select date, channel, sum(spend) as total_spend, count(distinct member_id) as total_members
from
(
        select *,
        case when cast(member_id as varchar) || cast(date as varchar) in (select * from desktop_only) then 'desktop'
                 when cast(member_id as varchar) || cast(date as varchar) in (select * from mobile_only) then 'mobile'
                 else 'both'
        end as channel
        from spending  
)
group by date, channel
order by date, channel



补充内容 (2018-7-12 07:47):
with里面没必要写both的subquery 多余了
回复

使用道具 举报

我的人缘0
miaozuoyu 发表于 2018-7-12 08:49:34 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (5)
 
 
0% (0)  踩
L家DS秋招这么早?
回复

使用道具 举报

我的人缘0
miaozuoyu 发表于 2018-7-12 09:13:03 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (5)
 
 
0% (0)  踩
抱歉第一行应该是sum(spend)
回复

使用道具 举报

我的人缘0
 楼主| hyper8866 发表于 2018-7-12 12:11:20 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  90% (18)
 
 
10% (2)  踩
miaozuoyu 发表于 2018-7-12 08:49
L家DS秋招这么早?

不知道呀 感觉SQL写起来是真麻烦...
回复

使用道具 举报

我的人缘0
 楼主| hyper8866 发表于 2018-7-12 12:13:12 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  90% (18)
 
 
10% (2)  踩
cixian1110 发表于 2018-7-12 07:46
问题有一处不清楚,假如一个member在第一天买了desktop第二天买了mobile,那么有两种可能
1.两天都算both
...

我觉得是第二种,我感觉核心就在于count=2是both...这要是我们公司数据库五行就出来了

哈哈替广大网友谢谢你的答案....
回复

使用道具 举报

我的人缘0
chipmunkL 发表于 2018-7-12 23:43:21 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (3)
 
 
0% (0)  踩
SELECT s1.date AS date,
(CAESE WHEN COUNT(DISTINCT s2.channel) = 1 THEN s2.channel ELSE "both" END) AS channel,
(SUM(s2.spend)) AS total_spend,
(COUNT(distinct member_id) AS total_members
FROM Spending s1 LEFT JOIN Spending s2
ON s1.member_id = s2.member_id AND s1.date = s2.date
GROUP BY date
ORDER BY date;

With React+D3v4 you'll learn the basics of building fast data visualization components in about an hour.


回复

使用道具 举报

我的人缘0
getdreamoffer 发表于 2018-7-13 10:41:32 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (5)
 
 
0% (0)  踩
请问lz是自己申请的吗?L家有data scientist职位吗 只看到senior的。。
回复

使用道具 举报

游客
请先登录

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|小黑屋|联系我们&一亩三分地论坛声明

GMT+8, 2018-11-19 21:58

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表