卓騰語言科技 實習企劃 | 暑期實習 @ Droidtown

Melody Lin
May 29, 2022

--

去年暑假(2021 Summer)有幸參與了卓騰語言科技的實習企劃,希望可以透由撰寫這段記錄回顧自己的成長,也希望能夠分享這段經驗給有興趣參與實習的人了解!

因為自己本身對於語言的興趣,我一直都希望可以了解NLP,但學校方面因為選課上的安排,所以一直沒有機會修習NLP的相關課程。因此,當初在Facebook上看到關於卓騰暑期實習資訊的分享時,真的超級興奮,當時也到卓騰的網站上面操作了Articut 中文斷詞、KeyMoji 情緒分析等,發現… 打開了新世界的大門(笑)!總之,我就這樣投出了履歷,最後很榮幸地收到了錄取通知。

去年的暑期實習計劃為期13週(從7月初到將近9月底),全程都是在線上舉行,每個禮拜五下午大家都會一起在Discord上見面、進行討論和學習,是一段非常新奇又很有收穫的旅程。

當時暑期實習主要分為三個階段:

  1. NLP、語言學基礎知識學習
  2. 學習如何使用卓騰的各種工具(Articut以及Loki)
  3. 專案開發

前面兩個階段主要就是幫大家打基礎的部分,為了保有期待感(?),在這裡就不多加透露了XD 比較特別的是,期間也有往年的實習生來跟我們分享他們當時的專案製作內容(真的很厲害!),幫助我們更深入地了解要如何運用NLP的工具來進行專案開發。專案是以一人或兩人的小組形式進行,當時我很幸運地在同期的實習生中找到了同樣對於心理諮商有興趣的夥伴,一起組隊完成了我們的專案 — 「憂鬱指數評估」。

以下想要先簡單跟大家介紹我們專案開發的基礎 — 「抑鬱語言的3種特性」:

  1. 大量負面的形容詞和副詞。(例如:厭惡、羞恥、懊悔、憤怒等)
  2. 使用更多第一人稱單數代詞(例如:我、我們等),與此同時,顯著減少使用第二和第三人稱代詞(例如:你、你們、他、他們等)。
  3. 慣常使用「絕對性詞彙」。(例如:通通、絕不、總是、完全等)

掌握抑鬱語言的特性後,我們透過文本蒐集定義權重,並使用Python及Articut進行開發,最後將其部署到LINE Bot上。當時實習生們分別來自各式各樣的領域和不同時區XD,大家的想法都很特別,有興趣的話在卓騰的Github上可以看到歷年實習生的作品。

對我來說,這次的實習經驗是非常可貴的。以往在學校進行專案製作時,都只會跟熟悉的資工系同學們一起合作,雖然或許減少了一些溝通上所需的時間,但卻也讓我一直侷限在資工系的框架中。然而,實習過程中,接觸到來自不同背景的夥伴們,終於讓我對資訊工程有了更多的想像。只要有需求,無論是大是小,任何專案的開發都是很有存在價值的!此外,和夥伴一起努力的過程中,我也更了解要如何來自不同背景的人合作和溝通。每週的進度匯報中,不僅得到了來自主管們和夥伴們的建議和鼓勵,也讓我更了解要如何掌握專案的開發進度以及更有效率地彙報進度的技巧。所以,無論是來自資工系還是任何科系,住在台灣還是任何國家,只要想要更了解NLP,別擔心,參與卓騰的暑期實習企劃絕對會讓你們收穫滿滿!

那麼,這次的分享就告一段落啦!謝謝看到這裡的大家!

--

--