网站首页 > 文章精选 正文
大数据近年来,发展如火如荼,很多人都选择学习大数据专业或者转行大数据,大数据里又包含很多就业岗位,那么,我们在面试大数据开发工程师时,需要面试哪些内容呢。一起来看看!
首先,不同岗位、不同公司、不同面试官问的内容是不一样的。
大数据开发包括Hadoop(ETL,Mapreduce),Spark(SparkSql和SparkStreaming),Python等,这是偏向技术。另外大数据开发看是否偏向数仓开发和数据分析,因为这样问的问题又会不一样。不同的面试官和公司用到的技术栈也不一样,问的问题也会有很大差别的。我们就根据常见问题的一起来看看。
一、自我介绍
一般上来就是自我介绍,谈下工作经历和项目经验,面试官会根据你的项目经验对你进行技术面试。在自我介绍时,一定要抓住核心说,不要太啰嗦,尽量放大自己的价值,让面试官感受到你对工作的热情,以及以后对公司贡献的能力。
二、知识技能方面
(一)、数仓开发
1,Java是必问的,不过问的不深,把Javase部分吃透,足以应付Java部分的面试。2,Hadoop生态,Yarn、Zookeeper、HDFS这些底层原理要懂,面试经常被问。3,Mapreduce的shuffle过程这个也是面试被常问的。4,Hbase和HIve,搞大数据这些不懂真的说不过去。5,Mysql、Oracle和Postgres数据库操作要回,Sql要会写。6,linux操作系统,这个简单得命令必须要懂,会写shell脚本更好了。7,Kettle或Sqoop这种数据处理工具至少要会一个。8,数据仓库建模、数据模型的问题。
(二)、技术方面
1,SparkSql和SparkStreaming,底层原理、内核、提交任务的过程等等,尽量深入内幕,这个经常会跟MapReduce作比较的。当然也要了解Storm和Flink,Flink这个建议要学会,以后用处会越来越广。2,Redis、Kafka、ElasticSearch这些都得懂原理,深入了解,会使用,会操作,会调优。3,impala和kylin这些尽量也要了解会用4,Python这个要是有能力,有精力,建议也要往深处学习,我目前正在自学中。5,集群的问题,包括一些简单的运维知识。6,大数据数据倾斜的问题,包括Spark JVM内存调优问题等等。
最后可能还会问你最近几年的职业规划等,面试的话大体是围绕以上内容进行的,以上内容仅供参考,一些技术要求等可以详情参考公司招人的要求,并展开做一些面试的准备。
- 上一篇: Sqoop高频面试题知识点总结
- 下一篇: Delta Lake在Soul的应用实践
猜你喜欢
- 2025-03-07 阿里云云原生一体化数仓—数据治理新能力解读
- 2025-03-07 Apache Hive分区:定义、实现方式、优劣势分析、分区管理实践
- 2025-03-07 Delta Lake在Soul的应用实践
- 2025-03-07 Sqoop高频面试题知识点总结
- 2025-03-07 大数据技术之Hive
- 2025-03-07 Hive最全总结,学习与面试,收藏这一篇就够了!
- 2025-03-07 Hive 迁移参考方案及测试(上)
- 2025-03-07 2021年超全超详细的最新大数据开发面试题
- 2025-03-07 【大数据】Hive 小文件治理和 HDFS 数据平衡讲解
- 2025-03-07 5.HIVE定位调优指导
- 最近发表
-
- 100%开源免费的低代码/可视化数据分析、数据展示平台
- Spring Boot跨域问题终极解决方案:3种方法根治CORS报错
- 永久免费内网穿透很简单,一看就明白
- Odoo 用户菜单架构解析及创建和管理实战
- 关于编码的那些事 - URL 编码(编码url是什么意思)
- 20 个让人惊叹的 JavaScript 单行代码技巧,效率瞬间提升
- 如何使用java.net.URLConnection发起和处理HTTP请求
- 崩溃!代码总掉链子?6 个 JavaScript 技巧助你稳操胜券
- 抓狂!代码总出错?5 个 JavaScript 技巧助你逆风翻盘
- 前端性能拉胯?这 8 个 JavaScript 技巧让你的代码飞起来!
- 标签列表
-
- newcoder (56)
- 字符串的长度是指 (45)
- drawcontours()参数说明 (60)
- unsignedshortint (59)
- postman并发请求 (47)
- python列表删除 (50)
- 左程云什么水平 (56)
- 计算机网络的拓扑结构是指() (45)
- 稳压管的稳压区是工作在什么区 (45)
- 编程题 (64)
- postgresql默认端口 (66)
- 数据库的概念模型独立于 (48)
- 产生系统死锁的原因可能是由于 (51)
- 数据库中只存放视图的 (62)
- 在vi中退出不保存的命令是 (53)
- 哪个命令可以将普通用户转换成超级用户 (49)
- noscript标签的作用 (48)
- 联合利华网申 (49)
- swagger和postman (46)
- 结构化程序设计主要强调 (53)
- 172.1 (57)
- apipostwebsocket (47)
- 唯品会后台 (61)
- 简历助手 (56)
- offshow (61)