星期五。見面

程式 | 學習 | 日記 | 玩樂

    [論文速速讀]系列文章介紹

前言

論文速速讀系列是從今年四月開始,我開始寫一些論文的中文讀書筆記,還記得第一篇是[論文速速讀]ReZero is All You Need: Fast Convergence at Large Depth,之後發現儘管自己已經陸續產出了幾篇文章,可是好像都沒正式的跟大家介紹這系列文章的由來xD

所以這篇文章就是來講講這系列文章到底是什麼,以及我會和會想寫這些文章。

論文速速讀系列是什麼?

由於在AI領域每年總是有一些非常重大的突破和應用,如果跟不上潮流很有可能就會錯失許多機會。例如,對NLP領域熟悉的話你一定聽過2013年的word2vec、2014年開始流行的attention、2018年的Bert…這些很有名的技術。

還記得Bert剛出的時候我好像剛進碩士實驗室,當時只知道這個技術屌打了當時一堆NLP的研究,但我想也想不到兩年後Bert已經造成如此大的影響力,一堆基於Bert的變形應用在各大領域上都取得了非常優異的結果。

因此,我想要藉由這系列的文章讓自己能夠更加快速的了解AI的新技術和研究,同時逼迫自己看論文xD

繼續閱讀

    [課程筆記]課程筆記系列總覽

本文記錄了自己在上課時所記錄的一些課程筆記,可以透過這邊文章連結到所有以往發過的課程筆記文章。

繼續閱讀

[Python]將字串轉變成正確的型態

最近在實作某個作業的時候遇到這樣的問題,我用read_csv()將資料讀進來了,但是因為讀進來後都會變成str的型態,我想要把他們自動轉成正確的資料型態,例如,有一筆list如下:

繼續閱讀

[Python]用Histogram呈現文章單詞出現數量

這次的練習是統計一篇英文文章出現的單字數量,並將頻率最大的前十個單詞透過直方圖(histogram)表示出來。

一些比較有問題的點在於:

  • 拿到的文章中有著一些標點符號,ex:, . ‘ “ \ - …這種,在統計單字數量的時候如果沒有處理掉這些符號就會有不同的結果,比方說:”woman”和”woman.”會是不同的單詞。
  • 第二個問題是在處理文本的時候發現裡面夾雜著utf編碼的內容,所以在開檔的時候要指定encoding = “utf8”

繪圖的部份使用matplotlib這個lib,如果沒有安裝過的話要先行安裝,在cmd下輸入pip install matplotlib

繼續閱讀

[Python]終極密碼

摁,就是終極密碼,沒什麼好講的。

比較值得提的是要做輸入的防呆,也就是說不能輸入小數、英文…

對於這個要求使用了try…except…解決了,原理大概是input()會回傳一個String,那如果對這個字串作轉型變成int呢?會有兩種情況:

繼續閱讀

[Weka]連結mysql資料庫

weka是一款很好用的資料分析工具,平常在分析檔案外,也會有遇到需要進入到資料庫進行分析的狀況,以下將介紹如何設定使得weka可以存取mysql資料庫 前置作業:

  1. 下載資料庫驅動:mysql-connector-java-5.1.6.jar
  2. 下載完後新增環境變數:對我的電腦點右鍵->內容->進階系統設定->環境變數->user的使用者變數->在”CLASSPATH”內新增mysql-connector-java-5.1.6.jar的路徑(Ex:我的是D:\WEKA\Weka-3-8\lib\mysql-connector-java-5.1.45-bin.jar),若沒有CLASSPATH則自己新增一個
  3. 修改weka設定檔,到weka的資料夾找到weka.jar,解壓縮後找到weka->experiment->DatabaseUtils.props.mysql
  4. 這是一個設定檔,但weka只會尋找”DatabaseUtils.props”這個檔名,所以把後面的.mysql拿掉
  5. 修改下面兩個資料
繼續閱讀

[Python]透過PIL改變圖片的pixel

這次練習的是透過Python讀取一張彩色的圖片,將圖片每個pixel的RGB減半,最後會是圖片亮度變暗的效果。 PIL(Python Imaging Library),是一款提供給Python的影像處理套件,使用前必須先透過pip安裝相關的套件。 windows如果要在cmd使用pip的話需要設定環境變數:

繼續閱讀

[研究所推甄]資工所推甄心得3-找尋指導教授

其他文章點這裡:

[研究所推甄]資工所推甄心得1-備審準備

[研究所推甄]資工所推甄心得2-口試過程

這篇來講最後剩下的部分:

  1. 推甄結果
  2. 推甄前的準備
  3. 推甄過程的準備
  4. 口試經驗分享
  5. 找指導教授的過程
繼續閱讀

>