谈谈使用过的几款咖啡机

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
H1B/绿卡遥遥无期
又不想回国
来东南亚最大的互联网集团工作?
码农求职神器Triplebyte:
不用海投
内推多家公司面试
坐标湾区
Games Startup
招聘游戏开发工程师
游戏初创公司招聘工程师、UIUX Designer和游戏策划
查看: 2685|回复: 3
收起左侧

[统计生统] Interview project求教

[复制链接] |试试Instant~ |关注本帖
我的人缘0
dandelionjmy 发表于 2014-6-28 07:08:37 | 显示全部楼层 |阅读模式
  此人我要顶:
 
0% (暂未有人投票) 【我投】
  此人我要踩:
 
0% (暂未有人投票) 【我投】

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
本帖最后由 dandelionjmy 于 2014-6-28 07:16 编辑

最近收到一个Interview的project, 看起来挺简单的,不过因为我不是统计背景,稍微有点吃力。找工作有段时间了,真心希望能拿下这个工作。先说下背景,小女子有应用数学的学位,也是思考了很久觉得往统计编程方面转比较有希望拿到offer. 题目如下, 问题比较长,我自己思考了很久,有些疑问希望大家能给予点拨。. from: 1point3acres

Reginald Vinegar Industries Inc, a major vinegar producer, must provide health insurance to its employees. Every few years, Company A’s insurer, InsurAHealth, reviews the health status of the employees. To do this, InsurAHealth calculates a health score between 0 and 6, where 6 denotes a very sick person. InsurAHealth calculates this score every quarter and that the employees have gotten sicker. Mean Health Score in Quarter 1 was 3.4, in Quarter 6 it was 3.5, and Quarter 12 it was 3.9.        

Reginald Vinegar Industries Inc has hired you to evaluate InsurAHealth's claim that employees are sicker. The ‘health score’ is a proprietary tool used by InsurAHealth, and it does not release the items that go into its formula. InsurAHealth has provided data over 12 quarters on 2,000 employees from Company A. This is a representative sample of the employees at the company, and we know that the information included in this data is not part of the health score calculation.            

You should not spend more than two hours on this investigation. If a question is unclear to you or you want more clarification, answer to the best of your ability as no questions will be answered regarding the prompt. Many questions can be approached from multiple angles and have many correct answers. Regression analysis is not necessary to answer these questions, but
can be used if you like. Feel free to manipulate/subset the data in any way you see fit and use extra sheets, graphs, or whatever tools you may like. This tab and the data tab are locked, so you will need to copy and paste the information to manipulate it. The only requirement is that all output should be placed in this excel workbook and all work and calculations be shown.   

Questions:                                    
1) What are the demographic characteristics of employees at Reginald Vinegar Industries Inc?                                    
    Suggestion: Create a few tables, check if demographics change over time
                              
2) What characteristics is the health score associated with?                .留学论坛-一亩-三分地
    Suggestion: Create a few scatter plots                                
. 围观我们@1point 3 acres                                    
3) Based on the data provided, how do you evaluate InsurAHealth's claim that employees are getting sicker?                                    
    Suggestion: First list how you would evaluate the claim. Then, time-permitting, implement the steps you suggested.  

数据太大,上传不了附件, 先贴一张图片, 如果有人想要全部数据的话我也可以发给你。我的想法是:
1)用SAS做了一个table, 看一个各个characteristic有没有随时间变化。. From 1point 3acres bbs
2)感觉好像是画scatter plots, 看一下health score和age, hospital visit等等因素有没有关系。不知道这样理解正确么?.本文原创自1point3acres论坛
3)第三个有比较大的疑问。
首先每个quarter的测试人数都是不一样的,也就是说,第1个quarter只有600个sample, 第12个quarter有快2000个sample. 而且quarter之间不是independent的。如果用repeated measure来看mean有没有随时间变化的话,算是missing data了。
其次,health score 虽然说是0-6之间,但是有些是10,我把这些数据去掉了。我先做了个正态性检验,结果是数据不符合正态分布,但是直方图看起来挺像的,当然我还没有测residual是否正态。然后我就用了proc mixed来看均值变化是否显著。结果是从第1个quarter到第12个quarter均值变化是显著的,但是如果只测2-11quarter, 均值变化是不显著的。我觉得这样的话是不能证明employees are getting sicker的,因为health score很可能跟季节或者什么因素有关。-google 1point3acres
不知道大家觉得这个用proc mixed可以吗?还是有什么别的方法?
非常感谢!

. 1point 3acres 论坛

-google 1point3acres
interview problem.png

上一篇:转统计的相关问题
下一篇:自动化转专业申请
我的人缘0
瓷心娃娃 发表于 2016-3-4 08:36:00 | 显示全部楼层
  此人我要顶:
 
100% (1) 【我投】
  此人我要踩:
 
0% (0) 【我投】
在论坛搜sas的时候居然发现这个帖子。一毛一样的题我也做过,是不是和LZ面的同一个公司啊。
回复 支持 反对

使用道具 举报

我的人缘0
grace8547 发表于 2016-5-14 22:53:07 | 显示全部楼层
  此人我要顶:
 
0% (暂未有人投票) 【我投】
  此人我要踩:
 
0% (暂未有人投票) 【我投】
楼主,我在面试的时候也遇到一样的问题,我也是应用数学背景。第一题做出来了,第二题画了scartter跟historgram感觉哪个变量都跟health score没有关系和影响,在health score 2到6之间点分布很均匀,在10那个地方很突兀有一组数据。第三题完全不知道从哪里入手。
回复 支持 反对

使用道具 举报

我的人缘0
grace8547 发表于 2016-5-14 22:54:24 | 显示全部楼层
  此人我要顶:
 
0% (暂未有人投票) 【我投】
  此人我要踩:
 
0% (暂未有人投票) 【我投】
瓷心娃娃 发表于 2016-3-4 08:36
在论坛搜sas的时候居然发现这个帖子。一毛一样的题我也做过,是不是和LZ面的同一个公司啊。

我也刚好做到这一组题目,第三题不知道从何入手,能跟您求教一下吗?
回复 支持 反对

使用道具 举报

游客
请先登录

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html






手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-6-24 13:13

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表