點(diǎn)擊上方 "大數(shù)據(jù)肌肉猿"關(guān)注,?星標(biāo)一起成長(zhǎng)
點(diǎn)擊下方鏈接,進(jìn)入高質(zhì)量學(xué)習(xí)交流群
今日更新| 1052個(gè)轉(zhuǎn)型案例分享-大數(shù)據(jù)交流群
分享學(xué)習(xí)群一位同學(xué)的大數(shù)據(jù)求職轉(zhuǎn)型經(jīng)驗(yàn),他本科是二本機(jī)械方向,研究生是一本生物醫(yī)學(xué)方向,原本考研就是為了轉(zhuǎn)到計(jì)算機(jī)方向,因?yàn)榉謹(jǐn)?shù)不夠調(diào)劑了。隨后家里人也給安排了相關(guān)醫(yī)學(xué)院研究工作,但他放棄了,自學(xué)了大數(shù)據(jù)拿到米哈游58同城、比亞迪吉利、美的藍(lán)月亮等offer。
個(gè)人背景:
本科是不知名的二本院校,研究生是東北一所一本院校,導(dǎo)師的方向是生物信息和醫(yī)學(xué)圖像處理。我本科的方向是機(jī)械工程,研究生的方向是醫(yī)學(xué)圖像處理,在2022年10月成功的發(fā)表了一篇sci二區(qū)的期刊論文。
在2022年7月,我收到了米哈游、第四范式等公司的實(shí)習(xí)offer。由于要在8月回復(fù)論文審稿人的意見,家里人安排了一所研究院進(jìn)行實(shí)習(xí)。但是在研究生學(xué)習(xí)過程中、實(shí)習(xí)過程中,發(fā)現(xiàn)自己不太適合科研,學(xué)歷也沒有優(yōu)勢(shì)。
之前在考研二戰(zhàn)期間,由于想轉(zhuǎn)開發(fā)方向就認(rèn)識(shí)了峰哥,后來也在峰哥的指導(dǎo)下,我學(xué)習(xí)了一系列大數(shù)據(jù)相關(guān)的知識(shí),最終在秋招拿到了58等公司的offer。
學(xué)習(xí)過程:
我是2019年的時(shí)候偶然看到了峰哥的公眾號(hào),那時(shí)候在考研失利,有些迷茫,通過刷完峰哥的大數(shù)據(jù)轉(zhuǎn)型案例,了解到眾多同學(xué)在峰哥的指導(dǎo)下,進(jìn)入到互聯(lián)網(wǎng)大廠。那時(shí)候面臨著春招,我十分迫切,找到峰哥了解了學(xué)習(xí)路徑。
峰哥根據(jù)我的個(gè)人情況幫我規(guī)劃了學(xué)習(xí)路徑,我在學(xué)完hadoop后,家里人催著考研,于是重新進(jìn)入到考研隊(duì)伍中,然后被調(diào)劑到了東北一所一本院校。
在研一期間,對(duì)算法有些憧憬,甚至還有讀博的念頭,使得我沒有堅(jiān)持按照峰哥規(guī)劃的學(xué)習(xí)路線繼續(xù)學(xué)習(xí)。當(dāng)我經(jīng)歷了研一的科研生活,了解到國(guó)內(nèi)的科研狀況和算法的就業(yè)形勢(shì),使得我失去了科研和算法的熱情。
于是,我在研二重新開啟了大數(shù)據(jù)的學(xué)習(xí),前期由于在寫論文,進(jìn)度比較慢,在2022年才開啟數(shù)倉項(xiàng)目、spark、以及spark項(xiàng)目的學(xué)習(xí)。(根據(jù)我的經(jīng)驗(yàn)教訓(xùn),這里建議大家不要戰(zhàn)線拖太久,不要拖沓,持續(xù)學(xué)習(xí))
實(shí)習(xí)簡(jiǎn)歷投遞:
我是4月份投稿的論文,所以我很晚才投實(shí)習(xí)崗位。4月11日開始準(zhǔn)備實(shí)習(xí)的面經(jīng),然后找峰哥修改簡(jiǎn)歷,5月底開始投實(shí)習(xí)崗位。(根據(jù)我的經(jīng)驗(yàn)教訓(xùn),這里建議大家提前準(zhǔn)備面經(jīng),并且大多數(shù)的公司實(shí)習(xí)崗位是2月、3月就開始了,我投的時(shí)候已經(jīng)沒有幾點(diǎn)公司招實(shí)習(xí)崗位了,大部分招聘的實(shí)習(xí)崗位還是外包。
要多進(jìn)行面試,不要害怕面經(jīng)沒有背好,面經(jīng)是背不完的,到了后期(包括秋招),我發(fā)現(xiàn)大部分公司問的問題都有點(diǎn)類似,在面試的過程中去豐富面經(jīng)。)
大致情況:
offer:米哈游、華云慧通、華大基因、第四范式
面試掛:好未來、煜象科技、北明數(shù)科
(1)好未來(已掛)
① UDTF函數(shù)
② 維度建模
③ hive sql 窗口函數(shù)(有一個(gè)用戶,計(jì)算每個(gè)月的累計(jì)薪資是多少?一月份賺了3000,二月份賺了6000,想二月份變成9000,每一次都是累加的)
④ 拉鏈表
(2)煜象科技(已掛)
① 自我介紹
② 介紹項(xiàng)目
③ 項(xiàng)目中使用了哪些算子函數(shù)
④ hive sql 使用了哪些函數(shù)
⑤ 數(shù)倉創(chuàng)建了哪些表
⑥ 使用了哪些action算子
⑦ spark、hive數(shù)據(jù)傾斜
⑧ hive表的類型
⑨ hive的存儲(chǔ)格式
⑩ yarn的資源調(diào)度
(3)北明數(shù)科(已掛)
① 自我介紹
② 項(xiàng)目介紹
③ sqoop調(diào)度(數(shù)據(jù)遷移)
④ 如何從mysql中讀取數(shù)據(jù)到hive中
⑤ 數(shù)倉每一層的表是如何體現(xiàn)的
⑥ hive 注冊(cè)UDF的過程
⑦ 在哪操作hive sql的(定時(shí)shell)
⑧ 為什么要選擇列式存儲(chǔ)?
⑨ 列式存儲(chǔ)的適用場(chǎng)景
⑩ yarn的job提交流程
? java 中的集合——map接口和collection接口
? java 樹結(jié)構(gòu)的應(yīng)用(hashmap使用了紅黑樹)
? 完全二叉樹的概念——葉子結(jié)點(diǎn)只能出現(xiàn)在最下層和次下層,且最下層的葉子結(jié)點(diǎn)集中在樹的左部。
秋招簡(jiǎn)歷投遞:
在7月和8月,我在修改論文,回復(fù)審稿人意見,錯(cuò)失了良機(jī),沒有及時(shí)的投遞提前批。等到9月初才開始投正式批,一開始投的時(shí)候還挑三揀四,一天只投了一兩家,導(dǎo)致我在九月中旬就面試完兩三家后,到十月中旬都屬于“空窗期”,沒有任何筆試和面試。
在九月下旬,才開始著急,然后再瘋狂的投遞簡(jiǎn)歷。根據(jù)我的經(jīng)驗(yàn)教訓(xùn),這里建議大家要把握住提前批和正式批一開始的時(shí)候,可以先投一些公司,不要全投也不要都不投。
正式批總共投了116家公司,筆試了39家公司(包括6家銀行),面試了25家公司(包括4家銀行,大部分是市級(jí)的分行,聽說要輪崗幾年,基本放棄了),收到10家公司的offer(58、比亞迪吉利等)。
大致情況:
loffer:58同城、比亞迪吉利汽車、藍(lán)鴿藍(lán)月亮美的,茄子科技,還有幾家銀行
(1)茄子科技
1)一面:
① 自我介紹
② 實(shí)習(xí)介紹
③ kafka消息丟失重復(fù)問題
④ kafka防止不丟失
⑤ 大數(shù)據(jù)行業(yè),要解決什么問題?那么大的數(shù)據(jù)量,會(huì)給我們帶來什么問題?——數(shù)據(jù)存儲(chǔ)問題、分類問題、數(shù)據(jù)采集問題、數(shù)據(jù)倉庫問題(結(jié)構(gòu)化的數(shù)據(jù))、數(shù)據(jù)計(jì)算問題(hadoop、mapreduce、hive、spark)
⑥ kafka在大數(shù)據(jù)領(lǐng)域的作用是什么——削峰和緩存
⑦ 什么場(chǎng)景需要會(huì)使用kafka——消息隊(duì)列、數(shù)據(jù)采集、流式處理
⑧ 什么是數(shù)據(jù)湖——是一個(gè)集中式存儲(chǔ)庫,一個(gè)以原生格式存儲(chǔ)各種大規(guī)模原始數(shù)據(jù)集的數(shù)據(jù)庫,它允許以任何規(guī)模存儲(chǔ)所有結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
⑨ 實(shí)現(xiàn)一個(gè)數(shù)據(jù)湖,需要解決什么問題?——數(shù)據(jù)導(dǎo)入、數(shù)據(jù)消費(fèi)、數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)存儲(chǔ)等
⑩ hive與mapreduce有什么區(qū)別
? hive架構(gòu)
2)二面:
① 自我介紹
② 數(shù)據(jù)倉庫分哪些層
③ 為什么要對(duì)數(shù)據(jù)倉庫分層
④ 數(shù)據(jù)量大小
⑤ hive與mysql有什么區(qū)別
⑥ hive的架構(gòu)
⑦ 介紹一下spark,常用的算子(行動(dòng)算子、轉(zhuǎn)換算子)
⑧ rdd、dataframe、dataset的區(qū)別
⑨ 實(shí)習(xí)
(2)58同城
1)一面:
① 自我介紹
② mapreduce工作原理
③ shuffle過程
④ mapreduce中的reduce task數(shù)量、map task數(shù)量以及partition怎么計(jì)算出來的
⑤ 為什么對(duì)數(shù)倉進(jìn)行分層
⑥ 維度建模
⑦ 星型模型與雪花模型的區(qū)別
⑧ spark數(shù)據(jù)傾斜遇到的場(chǎng)景
⑨ kafka消息擠壓?jiǎn)栴}
⑩ 在項(xiàng)目中sparkStreaming實(shí)時(shí)做什么功能?
? sparkStreaming計(jì)算完的數(shù)據(jù)是存放在什么地方?(mysql)
? 建議學(xué)習(xí)flink
2)二面:
① 自我介紹
② 在實(shí)習(xí)、項(xiàng)目過程中遇到了什么困難
③ 對(duì)大數(shù)據(jù)哪一塊比較了解?工作原理?
④ hive為什么要兩個(gè)計(jì)劃?物理計(jì)劃和邏輯執(zhí)行計(jì)劃?這兩個(gè)有什么區(qū)別?
⑤ kafka消息丟失和重復(fù)問題
⑥ 大數(shù)據(jù)中為什么會(huì)用kafka,不用其他消息隊(duì)列的組件呢
⑦ 遇到的技術(shù)挑戰(zhàn)(hive數(shù)據(jù)傾斜)
⑧ 業(yè)界最近的一些技術(shù)(數(shù)據(jù)湖)
(3)吉利
① 自我介紹
② 項(xiàng)目介紹
③ 數(shù)據(jù)量
④ hive sql執(zhí)行了多少時(shí)間
⑤ hive 數(shù)倉分層,每層的含義
⑥ kafka消息擠壓
⑦ kafka消息丟失與重復(fù)問題
⑧ spark數(shù)據(jù)傾斜問題
⑨ 小文件過多,文件分配不均與的問題(spark)
⑩ sql窗口函數(shù)以及之間的區(qū)別
? 手撕spark代碼:wordcount
? 實(shí)習(xí)經(jīng)歷
? 學(xué)校、實(shí)習(xí)團(tuán)隊(duì)溝通是否以接觸老師為主,有木有除了導(dǎo)師以外的人
大家會(huì)發(fā)現(xiàn),其實(shí)我的面試基本也是圍繞著hive、spark、kafka等幾個(gè)點(diǎn)來進(jìn)行的,有些時(shí)候面試官會(huì)問一些發(fā)散性的問題,這些問題我也會(huì)往我知道的,背過的面經(jīng)上靠。
并且,面試官主要是根據(jù)我們的簡(jiǎn)歷來提問,所以,我們要根據(jù)簡(jiǎn)歷中項(xiàng)目涉及到的知識(shí)點(diǎn),然后根據(jù)面經(jīng)來提前準(zhǔn)備;hr面最好也要提前準(zhǔn)備一下,準(zhǔn)備一下hr經(jīng)常會(huì)問的一些問題。
總結(jié):
能在本科求職盡量在本科完成,目前市場(chǎng)來看經(jīng)驗(yàn)比學(xué)歷更重要。因?yàn)榭佳绣e(cuò)過了好幾年,大家不要像我這樣拖沓,一定提早準(zhǔn)備,越早越好,因?yàn)檫^程會(huì)有各種不確定因素影響學(xué)習(xí),希望我的經(jīng)歷能對(duì)大家有所啟發(fā)。
雖然我簽的公司不屬于互聯(lián)網(wǎng)大廠,但還算比較滿意。最后要感謝峰哥,我經(jīng)常找峰哥咨詢學(xué)習(xí)路線和面試問題。在峰哥的幫助下,我在大數(shù)據(jù)的學(xué)習(xí)過程中也沒有走太多的彎路。文章來源:http://www.zghlxwxcb.cn/news/detail-401786.html
--end--文章來源地址http://www.zghlxwxcb.cn/news/detail-401786.html
掃描下方二維碼
添加好友,備注【交流】
可圍觀朋友圈,也可私信交流
到了這里,關(guān)于雙非生物醫(yī)學(xué)碩士放棄研究院工作,零基礎(chǔ)轉(zhuǎn)型大數(shù)據(jù)開發(fā)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!