師兄在騰訊,就讓師兄內(nèi)推了一下騰訊自然語言處理的實習(xí)。在內(nèi)推前,簡單把李航的統(tǒng)計學(xué)習(xí)方法,簡歷涉及的知識點都過了一遍,整理了一下,同時leetcode刷了大概100題。 準備過后就把簡歷給師兄了。投完簡歷當天下午就收到了騰訊的短信約晚上面試(這也太效率了= =)。下面簡單記錄一些面試的問題(很多問題都是項目涉及的知識點,每個人可能都不一樣)。
一面(技術(shù)面) 基本就是把簡歷過了一遍,問問一些項目上的細節(jié)。
1、先簡單自我介紹一下吧。
2、看你之前實習(xí)過,說說當時實習(xí)都做了些啥。
3、介紹一下transformer吧,除了self-attention還知道哪些attention。
4、看你用了反向翻譯,簡單介紹一下吧,除了這個還知道哪些數(shù)據(jù)擴充的方法嗎,每個方法有什么區(qū)別?
5、介紹一下R2L-Rerank吧。
6、講一講bert,roberta吧,BPE和word piece有什么區(qū)別?
7、介紹一下FGM。
8、介紹一下Focal loss。
9、python的迭代器和生成器。
10、算法題:打印二叉樹從右邊看能看到的節(jié)點。 一面還算順利結(jié)束后第二天就接到了二面的電話。
二面(技術(shù)面) 基本也是把項目比賽過一遍,然后問一些細節(jié)。
1、簡單介紹一下自己吧。
2、介紹一下AUC吧,和準確率有啥區(qū)別。
3、介紹一下F-score,Macro-F1和micro-F1有啥區(qū)別。
4、bert如果輸入超過512怎么辦。
5、那你介紹一下transformer-xl吧。
6、如果你自己訓(xùn)練輸入長度為1024的bert,使用的顯存會是原來的幾倍。
7、你在投的論文做的是什么,介紹一下,看你是用fairseq框架寫的,具體修改了哪些模塊。
8、算法題:最長上升子序列。
9、用過單機多卡或者多機多卡訓(xùn)練嗎?講一講。
10、你有什么要問我的嗎? 二面也比較順利,第二天就接到了三面的電話。
三面(技術(shù)面) 我當時看面經(jīng)別人都是兩面,我居然有三面= = ,三面應(yīng)該是一個leader面的。
1、之前實習(xí)是負責什么的,大概開發(fā)的流程是什么樣的。
2、你做的這些項目是偏實驗的的還是有一定的工業(yè)落地的,比如做了一個網(wǎng)站或者api等。
3、你們平常打比賽的時候,隊伍是怎么合作的?
4、你做的項目里的公開數(shù)據(jù)集你知道是怎么采集的嗎?它會不會有很多臟數(shù)據(jù)?這些臟數(shù)據(jù)對模型有什么影響?你是怎么處理它們的?
5、有看過模型的bad case嗎?針對bad case做了哪些提升?
6、系統(tǒng)地介紹一下你研究的這個方向。最近你這個方向效果最好的論文是哪篇?它是怎么做的?
7、你有什么想問的嗎?
三面沒有算法題,感覺問的是一些方法論的東西。答得也還不錯,沒過幾天就接到了HR的電話。 HR面 HR很親切,面試體驗很棒,上來先給我介紹了一下他們部門的一些發(fā)展歷史和現(xiàn)在的情況,然后了解了一下我的實驗室,實驗室的研究方向,之前的實習(xí)情況,大概詢問了可以入職的時間。整個面試下來感覺平時的積累很重要,之后有空了也準備把之前整理的資料慢慢寫成博客。
責任編輯:xj
原文標題:騰訊自然語言處理實習(xí)面經(jīng)
文章出處:【微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
騰訊
+關(guān)注
關(guān)注
7文章
1637瀏覽量
49381 -
自然語言處理
+關(guān)注
關(guān)注
1文章
600瀏覽量
13484 -
自然語言
+關(guān)注
關(guān)注
1文章
285瀏覽量
13320
原文標題:騰訊自然語言處理實習(xí)面經(jīng)
文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論