清華學霸終極追求竟不是科研:打造影響力才能生生不息

學術頭條

本文經授權轉載自 學術頭條( ID: SciTouTiao),轉載請聯系出處

由于新冠全球大流行,許多原計劃赴美的人們近期難以獲得簽證。但我們注意到,關于使館簽證預約情況和預約心得已經有大觸幫我們收集好了,詳情可以訪問https://tuixue.online/visa/。

這個網站的創建者,正是一名原計劃今秋赴美國卡耐基梅隆大學攻讀碩士學位的學生。他在今夏畢業于清華大學計算機系,名叫翁家翌。

若你曾關注過計算機或是強化學習領域,可能對這個名字有些熟悉。沒錯,他正是用 1500 行代碼從頭開發天授[1]強化學習平臺的翁家翌。

2

圖 翁家翌(圖片來源:翁家翌)

翁家翌回憶這段經歷的時候提到,“天授”這個項目是他的畢業設計。選擇這個項目一方面是為了能與之后的方向銜接,另一方面是,他認為做平臺這樣類似基礎設施建設的項目很容易獲得影響力,因此值得做。

于是,考慮到畢業的剛需,以及這個項目本身的價值,翁家翌同學“花了十幾天”把結合速度和輕量于一體的“天授”強化學習平臺寫完了。

若你對這位十幾天從頭寫“天授”的同學感到好奇,很巧我們也是。所以我們和這位同學交流了一下,聽取了一些他的人生經驗。

從競賽轉高考:其實好像也沒什么轉折

翁家翌同學在讀高中時,期待著通過全國青少年信息學奧林匹克競賽(NOI)獲獎,獲得心儀學校的優惠錄取條件。這樣的目標對他來說只是要求他能在競賽中正常發揮。

但是,事情并不總是如計劃那樣發展。由于粗心失誤,翁家翌同學的競賽之路在最后階段折戟了。

提到競賽,翁家翌同學覺得也有些運氣成分。在他參加的 2015 年信息學競賽中,題目偏溫和,與往年相比區分度較低,因此他在細節上的粗心失誤就造成了十分嚴重的后果。

不過,在我們和翁家翌同學說到這段經歷是否讓自己有什么感觸時,他的回答是,“暑假就開始寫作業。”

所以實際上,翁家翌同學在高二暑假并沒有什么時間感到遺憾,有的只是為高考全力以赴。

由于之前把主要精力放在競賽上,翁家翌的基礎其實并不好,在高三開學第一次考試中年級排名是 233/600 名,“按這種成績在去年連隔壁福大都進不了”,翁家翌說。

不過經過一年的努力,翁家翌的高考成績排在福建省 210 名。

回憶起這一年,翁家翌覺得,“其實高考并沒有傳說中的那么可怕,就是天天睡了吃,吃完刷題,刷完題睡覺”。競賽考不好似乎也沒什么,“人生中還是有很多道路可以選擇的,關鍵在于你自己的努力。”

清華四年:從大一課程項目就發論文到不想做科研

翁家翌同學的科研經歷可以一直上溯到他在大一下學期選的面向對象程序設計課上。他在課程期末作業中,與同學一起組隊,通過基于規則的逃逸路線方法,幫助尋找藥物樣品遞送的最佳路由解決方案,且這一方法比先前基于網絡流的方法快 600 到 34 萬倍。其中,翁家翌同學主要負責算法設計。

這項課程作業獲得了當時的授課老師姚海龍教授的稱贊和鼓勵,相關工作目前已在 IEEE TCAD 期刊(CCF A)上發表[2]。

不過,翁家翌同學覺得這段“科研”經歷不怎么值得一提。一方面是他認為這個項目實際上算不上有挑戰性,他只是借用了在信息學競賽中遇到類似問題的解題思路;另一方面,他覺得在日新月異的計算機領域,發表期刊論文審稿周期有些漫長,對于初入科研的萌新來說有點消磨自己的科研熱情。

但翁家翌同學對科研的興趣實際上并未減退。在大二時,翁家翌同學想要參加 “學術新星培育計劃”。“學術新星培育計劃”是清華大學計算機系針對大二、大三學有余力的本科生實施的因材施教培養計劃,入選計劃的本科生將進入實驗室在導師的指導下參與課題組研究,并獲得參加學術會議、暑期學校、課外科技競賽、科研創業等學術科研活動的經費支持。

不過在選研究方向的時候,翁家翌同學遇到了問題。

“我當時比較喜歡的三個方向主要是圖形學,網絡安全和人工智能。” 翁家翌說。不過,他喜歡的做圖形學的老師沒在這個計劃的名單里面,計劃名單中也沒有做網絡安全方向的老師,于是就只能選擇人工智能方向了。

但實際上回憶一下,翁家翌同學覺得自己的動機比較膚淺,對圖形學感興趣是覺得一些電影渲染特效十分炫酷,并且在高中信息學競賽的時候最喜歡寫計算幾何題目的代碼;對網絡安全感興趣是覺得做個黑客很酷,對人工智能感興趣則是在高一的時候因為社團展示需要,曾寫過一個能玩 2048 的 AI,覺得很有意思。

這些獵奇心理實際上在他本科的日常生活中獲得了滿足,比如做一個炫酷的黑客,“調戲”學校的網絡[3]。

3

(圖片來源:翁家翌)

通常情況下,清華大學的學生成績查詢是在假期開始一段時間后才向學生開放的。所以一些學生為了實時看到自己的成績,會使用一些非官方技巧。其中一種方法是,在打印電子成績單的預覽界面可以看到自己的實時成績。

學校相關部門也很快意識到了問題,于是將預覽界面進行打碼。所以,想要看到實時成績的學生就只能花 10 元錢將成績單打印出來,才能看到無碼高清版本的實時成績。這樣,學生們覺得為了早些查成績花 10 塊錢有些不值,校方對此情況基本滿意。

但翁家翌同學在寒假的時候,不經意間發現了一個細節:電子成績單的支付金額是前端傳入的。也就是說,同學們可以在創建訂單時將支付金額直接修改(如修改成 0.01 元),這樣成功支付一分錢,同學們就可以看到自己的實時成績了。

這項漏洞在他上報之后,學校的相關部門對此進行了及時的修復。翁家翌同學也成為學校信息化中心學生組織的一員。

除了成為坊間傳說,翁家翌同學的科研“主業”,在外人眼里看來似乎也算進展順利。在 2018 年,他所在的團隊獲得了第三屆 VizDoom AI 競賽[4]冠軍,他是團隊中的核心成員之一。之后在大三暑假,他參與了加拿大蒙特利爾學習算法研究所 Yoshua Bengio 教授的課題研究,Yoshua Bengio 教授曾在 2018 年獲圖靈獎。

可翁家翌同學回憶起這些經歷的感覺是,每段科研經歷都不是同一個方向,而且他對每段科研經歷都算不上滿意。

在 VizDoom AI 競賽中,翁家翌所在的團隊提出了一種分層強化學習架構,在游戲中可以對環境進行感知和學習。

“我們最后勉強拿了冠軍。” 他認為他們的算法在實現的時候有些部分和標準接口存在出入,但他們認為這是由于組委會對相關細節沒有解釋清楚。另外,翁家翌原本期待這個項目能夠發表論文,但在花費了一番功夫之后,論文卻遭到拒稿。雖然后續論文修改之后,轉投了其他會議并最終發表[5],但這段體驗讓翁家翌同學感到有些不順。

3

圖 翁家翌和圖靈獎得主Yoshua Bengio教授合影(圖片來源:翁家翌)

而翁家翌在和圖靈獎得主 Yoshua Bengio 教授從事暑期科研時,涉及了一個自然語言處理和強化學習結合的課題。“覺得這個跨度有點大。” 翁家翌說。其實他本人對自然語言處理不算十分感興趣,他也對自己在這段經歷中的表現不滿意。

三段科研經歷接觸了三個不同的方向,讓翁家翌同學對科研產生了一絲倦怠。但是他認為自己是一個更偏向工程思維的人:對調參數、開拓新課題等一些不怎么感興趣的東西自己不會有自我驅動力,而對搭建流程框架則是熱情滿滿。

從搞AI到搞平臺:打造影響力才能生生不息

說到影響力,翁家翌同學想到了一句俗話:“淘金不如賣鏟子”。具體來說,他更想做一些能夠讓更多人受益的事情。

其實他的這個想法,是在完成了“天授”平臺重寫和簽證信息分享平臺之后重拾成就感才明白的。

“如果當一個碼農的話,最大的成就莫過于自己寫的代碼被更多的人、更多的系統使用。這也是開源社區生生不息的原因之一。” 翁家翌說。

在他回憶有沒有在清華留下未完成的遺憾時,他表示,一些太看重 GPA 的人,可能會因此失去自我,而根本沒有想清楚自己究竟想要的是什么。“有些人就這樣人云亦云地保研/出國讀 PhD,但是,他們真的想專心學術嗎?他們真的適合學術嗎?他們沒想過。”

所以,在經歷過不同方向上的科研項目嘗試后,他發現還是更喜歡那個愛搞事情的自己。那個在畢設中拒絕其他課題提議堅持要重寫天授的自己,和那個搭建出訪問量兩個月突破 200 萬的美國簽證記錄網站的自己。這些事不僅讓他感受到了自我價值的實現,也為他自己提供了更好的視野。

因為只有這樣才能盡可能的多經歷,去尋找自己真正想要做什么[6]。

當然,“搞事情”也并非一時興起。除了上面提到的一分錢打印成績單,他還有很多類似的小故事,而這些小故事往往是最初,翁家翌同學觀察到生活中的一些細節,發現了其中的潛在需求,于是順著這條思路,找到滿足需求的解決方案,而且提出的解決方案真切地幫助了有需求的人群。

這些經歷在他的成長過程中逐漸讓他體會到,雖然自己領悟能力比較強,比較擅長學習新知識,但自己想要的成就感并非源自于施展這方面的天賦獲得傳統意義上的學術成功。他更喜歡的是對生活中細節的觀察和思考,同時他還有強大的動手能力,能夠很快提供出問題的解決方案。

這是一種更加注重需求和實踐的工程思維:若只是框在知識積累范疇,就像是囤積了大量財富但從不將財富轉化為購買力,即使是發現了新的金庫,若是不能動它,財富的價值仍舊無法體現。當然,理學思維和工程學思維是相輔相成的,只有扎實的知識積累才能在遇到具體問題時快速形成思路,也因此能夠獲得更高的成就感。

后記

雖然一手創建了簽證信息交流平臺,但翁家翌同學本人的簽證目前還沒著落。

在問到未來怎么辦時,他說打算在家上網課。“這個碩士可能更主要給我提供了一些 social 的機會,比如認識更多優秀的同學、以及向國外的一些公司學習先進技術。” 翁家翌說。

但實際上,在畢業前夕,翁家翌同學曾有著延期一年的想法,嘗試向若干大廠的實習項目投遞簡歷,已經進行了一輪“面試練習”。這次“搞事情”的收獲是一份讓面試官覺得“在清北里面都算少見”的簡歷,和只想打一年短工的心態導致的各家大廠“全聚德”,并被前輩教育道“不要浪費時間實習”。[7]

所以,“只好上學去了。” 翁家翌說。

那就祝福這位少年,未來能在更寬廣的平臺上,看到更值得做的事。

參考:

[1] https://github.com/thu-ml/tianshou

[2] J. Weng, T. Ho, W. Ji, P. Liu, M. Bao and H. Yao, "URBER: Ultrafast Rule-Based Escape Routing Method for Large-Scale Sample Delivery Biochips," in IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, vol. 39, no. 1, pp. 157-170, Jan. 2020.

[3] https://twd2.me/archives/11513

[4] https://www.crowdai.org/challenges/vizdoom-2018

[5] S. Song, J. Weng, H. Su, D. Yan, H. Zou, and J. Zhu, "Playing FPS Games With Environment-Aware Hierarchical Reinforcement Learning." In IJCAI, pp. 3475-3482. 2019.

[6] https://zhang-ming-rui.gitbook.io/when-rocket-goes-up/er-da-xue-chu-qi/jiao_liu_suo_ji_er_2014_2014_deng_jun_hui_lao_shi

[7] https://www.zhihu.com/question/370957302/answer/1192331407

編者按:本文轉載自微信公眾號:學術頭條(ID:SciTouTiao),作者:學術君

可行性研究報告

廣告、內容合作請點這里:尋求合作

咨詢·服務

評論

0條)

“1.2億+”企業數據查詢

網友評論僅供其表達個人看法.

相關閱讀

精彩推薦

欧美区一区二区视频在线-国产欧美一区二区三区