专注大数据培训
我们一直在领跑

最新面试题集锦(9)- MetaApp 大数据开发笔试题

数据统计:

1. 有十万个淘宝店铺,每个顾客访问任意一个店铺事都会生成一条访问日志,存储表为 Visit,其中访问用户ID字段名称为uid,访问的店铺字段名称为store,请统计每个店 铺的UV.

select
store, count(distinct uid))
from visit
group by store; 

2. 有一亿个用户,被存储于表Users中,其中有用户唯一字段UID,用户年龄age和用户 消费总金额total,请以代码或技术方案阐述的方式,分别用SQL,或者spark core按照 用户年龄从大到小排序,如果年龄相同,则按照总消费金额按照从小到大排序.

select
uid,age,total
from users
order by age desc,total asc;

3. 当前用户人生阶段表LifeStage,有用户唯一ID字段,UID,用户人生阶段stage,其 中stage字段为各个人生阶段标签英文逗号分隔拼接内容,如:已买房,计划买车,并且每 个用户的内容不同,请使用Hive SQL 统计每个人生阶段的用户量.

select
stage,
count(1) as cnts
from 
(
select
uid,stage
from lifestage a lateral view explode(split(stage,',')) t1 as stage
) o
group by stage;

4.上一题中相同的数据场景,但是LifeStage中每行数据存储一个用户人生阶段数据, 如:一行数据UID字段内容为43,stage字段内容为计划买车,另一行数据UID字段内容已 43,stage字段内容为已买房,请输出类似于UID字段为43,stage字段内容为计划买车, 已买房这样的新的整合数据,并且给出Hive SQL语句.

select
uid,concat_ws(',',collect_set(stage)) as stage
from lifestage
group by uid;

算数问题:1 假设有一个整数,保存到文件中的大小为1GB 请问:这个整数做平方运算后保存到文件中约为多大?

算数问题:2 假设只能使用基础数据类型计算两个大数的乘积,描述基本思路即可

算数问题:3 lim(x->0)x/sin(x)=?

大题目一:

class Solution { 
	public int singleNumber(int[] nums) {

	//不能写伪代码,要考虑时间复杂度
   } 
}

class Solution { 
	public int singleNumber(int[] nums) {

		int num = 0;
		for(int i = 0;i<nums.length;i++){
			num = num ^ nums[i];
		}
		
		return num;
   } 
}

欢迎分享,转载有奖:多易教育 » 最新面试题集锦(9)- MetaApp 大数据开发笔试题