目標與達成狀況
目標一、閱讀二篇論文
完成日:未達成
此次閱讀目標為:
- 【CPED: A Large-Scale Chinese Personalized and Emotional Dialogue Dataset for Conversational AI】
- 【Personality in 100,000 Words: A large-scale analysis of personality and word use among bloggers】
達成1篇,僅讀完1。
目標二、使用開放資料做模型訓練
完成日:2/21
執行狀況:
根據CPED這篇論文所提供的資料,從電視劇中整理出大約14萬句對話,並請專家為每句話標上情緒、情境和大五人格。其中大五人格是我預期想要使用的。
電腦是M2晶片的Mac。透過BERT預訓練模型初步針對「神經質」這個類別做訓練。先用其中大約九千筆資料,以batch_size=8和Adam的learning_rate=0.0005做訓練。準確率大約落在50%, loss落在大約0.86,而每個epoch大約花費10分鐘。調整batch_size至30和50後,訓練時間縮短至大約8分鐘,而準確率些微上升至55%,loss落在0.82。
論文整體進展
在本期過程,學校也已經開學,而這學期選修的課程是指導教授的課,因此可以更有效率地和教授溝通和meeting。
目前找到中文的資料集並且進行初步的分析,接著需要思考所使用的技術以及是否還需要其他資料,這些都會隨時與教授做討論。同時要注意模型分析所使用的時間,避免整體進度落後。
論文就像是一道長長的隧道,每次感覺稍有進展,就會注意還沒看到出口,不確定還有多遠的距離,擔心時間是否足夠。
收穫與感想
一、不要過度苛責自己
有時自己狀態不佳、太過放鬆或是突然發現先前的做法繞了遠路,就會因為感覺進度一直落後而充滿壓力,在看了Dr. Kelly McGonigal的影片後,才提醒,「苛責自己」會讓人陷入惡性循環,更加容易逃避。即使要求自己在電腦前做事,腦袋就是難以專注或是無法好好運作。
而這就會如同影片說的,「當我們感到壓力大,內疚和羞愧時,這種感覺會使我們進入另一種狀態,這個『我』更容易感受到即時滿足、誘惑和焦慮的影響」
「有時我們會拖延、有時我們會掉鏈子,要去意識到這不是在批評你自己,而是在說明這個過程,重要的是你事後如何回應,而不是關於它的發生。」
我想這樣的思維能幫助自己去跟眼前的狀況拉開一段距離,雖然不會說讓自己充滿能量,但至少能幫助自己不要持續掉入負面狀態。
希望不管是在寫論文,或是努力前進的人,都能適時地「自我疼惜」,就算只是一點,你仍然在前進。
二、寫論文的七大不思議
雖然隨著論文的進度,逃避時間和苛責明顯變多了,但也發現生活似乎更有秩序一些。或許這就跟有人說,如果想要讓家裡變乾淨,就跟作家一起生活吧,當他拖稿的時候,就會自動做家事,有異曲同工之妙。以下是發現自己逃避論文的時候帶來的其他效果。
- 房間變乾淨。
- 保健食品變多。
- 跟家貓的感情變更好。
- 論文以外的待辦事項減少。
- 運動的次數變多。
- 盆栽的狀態變好。
- 每日走路步數變多。