top of page

學習

焦榮安:

一、Python 爬蟲的接觸與實作

 

雖然我已經對爬蟲有基本的認識了,而且老師在寒假的時候有先請我們嘗試爬練習爬PPT的網站,雖然有些困難可是問題通常都不會卡很久,後來才知道原來PTT是一個網站架構比較簡單的網站,在後來專題過程中要找網站時,發現很多網站架構都很不一樣,甚至是之前都沒有看過的形式,然而網站架構過於簡單也是很難抓的,因為這樣沒辦法很精確地找到自己想要抓到的東西,比如說:有些網站的標題會跟內文黏在一起,那要怎麼辦呢?,我現在遇到的辦法有兩個1.找到標題跟內文中間的文字,找到以後就可以用字串分割技術,把標題還有內文分開2.去其他地方找到標題,到網站的分頁的地方找到標題的標籤,另外在爬網站的時候還會遇到一個問題,就是它的內文印為字數太多還會有分頁,本來我是沒發現的,結果好險老師有提醒我,有些網站有別於PPT它的內文有時候過多時會以分頁的方式呈現,所以我就要利用迴圈的方式,找到最後一頁內文,由前往後把所有的內文加起來,所以了解網站架構也是一個很重要的學問。

二、word2vec & jiaba

這些對我來說都是很新的東西,所以最一開始初步在學的時候很慢,到現在也仍然沒辦法對其背後支持的原理有充分的了解,經過不斷嘗試之後,我也改了好幾版的程式,其中也跟老師還有同學討論了很多。

 

在學習這些東西中,我還遇到一件事,那就是我的python版本太舊,導致在一開始在跑模型時一直跑不出來,這種特殊的情況讓我足足浪費了兩個禮拜左右,後面怎麼解決的呢?因為我一直是不出來,真的受不了,所以我才選擇重灌anaconda,這問題自然迎刃而解。

蒙宗凌:

一、Python 爬蟲的接觸與實作

 

  在過去大學兩年間,我並沒有接觸Python語言,但很常聽別人說當今流行的是Python語言,很適合初學者等等,剛好也透過這次實習接觸到Python,從寒假一開始甚麼都不會到短短一個月不到就學會爬PTT並把內容抓下來,再到現在對Python已經不再那麼陌生了,雖然在有些於法和熟練度上可能害需要多多了解跟加強學習之外,但基本上已經脫離初學Python的頭銜了。

而在爬蟲的部分,對我來說是有點難,因為剛開始跟著網路上的教學去爬蟲的時候都可以一一解決,但一到要自己去找網站,或是去抓獨特的內容的時候,就會發現其實爬蟲不是想像中的的簡單,印為他要考慮的因素不是只有程式本身還有網站跟網路等等。可是就是因為這樣,現在可以把自己選擇抓的網站,完整抓下來,就會覺得當初的努力跟學習是值得的。

 

二、JavaScript & HTML5 & CSS

 

大概是在暑假七月底開始,我們小組開始需要網站去呈現我們的成果的時候,我開始第一次接觸JS,雖然大一的時候有因為必修有稍微寫過HTML,但到了現在有些遺忘,所以跟JS就一起學習了。因為我們網站需一奧一個框架,我從同學經驗分享中了解了一個一個較Vue.js的框架,很適合我這個專題使用,所以目前正在努力用Vue來寫出我們網站所以需要的框架​。

在這次的實習當中可以學到的不是只有關於程式方面的技術或是知識,更多的是如何去在一個團隊中扮演一個好角色、如何與成員們溝通、解決問題或是面對困難的能力。我覺得這些都是在經歷實習前,很少地方可以獲得這方面的經驗或是能力。無論是在學校甚至職場都十分需要這些能力,才能讓自己更再次面臨到這些問題或是進入一個對的時候,才不會感到慌張或是不該如何是好。

三、非技術面學習

而遇到編譯錯誤問題時,也從找不出問題而小氣餒到不再去認為自己找不出原因,也會帶著問題去求助身旁的朋友,一起討論如何解決,而且有時課堂上教的只能給你不用過濾的正確的觀念,真正能學到更豐富的內容,卻是在課後自己遇到問題時親自過濾出來的答案以及查詢時延伸的額外資訊。

黃榆程:

  • Python 爬蟲的接觸與實作   

    在我之前修過的課中只有一堂選修是有關 python 這個語言的課程, 也常常聽別人說 python 是現在的流行,很值得去學,透過這次的實習我 了借了更多有關 python 這個程式語言,雖然和之前學的 c++是大同小 異,但是有蠻多語法不太一樣,是需要去習慣的,一開始在練習抓 ptt 的 資料的時候,還時常會用 c++語法寫,現在對於 python 的語法也已經熟 悉很多了。

   

    而爬蟲也是從完全的不熟悉,到現在也有一定的認知了,一開始花了 很多時間去上網查資料,但是有時程式還是跑不出來,真的會令我很沮 喪,但是當看到自己寫的程式碼能夠如願的執行的時候,心理的成就感也 是不言而喻的。看著程式碼從無到有,雖然算不上什麼很厲害的程式,但 總覺得只要努力,就能得到成功及回報。

 

二、MYSQL

   在mysql方面,資料的匯入很花時間,有讓我頭痛很久,因為之前歲然有上過sql但是沒有用過python匯入資料庫過,過程中常常出現資料重複或是資料表對不起來的問題,在試過很多方法匯入後才成功,我也了解到關於sql一些在python的套件和用法。

三、非技術面學習

 

     在這次的實習當中我學到的不單單只有技術或是知識,更多的是如何 去扮演好一個團隊中的一員、如何與成員們溝通、獨立思考、解決問題的 能力、如何做好時間管理的能力。我覺得這些都是我還有不足的地方,也 是我覺得我必須必備的能力,無論是在學校甚至職場都十分需要這些能 力,才能自己己更上一層樓,也覺得自己比之前對程式更有興趣了一些, 不再把程式當作一種學科,而是一種自己的一種專業一個工具。

鄭云瑄:

  • Python 爬蟲的接觸與實作

在過去大學兩年間,我並沒有接觸過 Python 語言,直到大三才有稍微學了一點基本的語法。在當初和楊老師面試的時候,老師就有提到專題會需要用到 Python 作為爬蟲的程式語言,也是因為這樣的關係,在寒假前開始看一些相關 Python 語法的書籍,也藉著老師交代的寒假練習作業去熟悉 Python 爬蟲以及環境設定和挑選。直到現在,Python 對我來說已經不再是很陌生的程式語言,雖然在使用的熟練度上還需要再多加強,但基本的運用也算有點熟練了。

 

  在程式撰寫的過程中,多少也有遇到一些問題,尤其是寒假期間最為嚴重,可能因為剛正式使用 Python 去寫程式,因此很多時候只能依靠網路上的資料去修改,然後再花時間去逐一查出程式語法的用法和代表的意思,甚至為了增強自己的印象,多做了一個 PPT 的詳細解說檔案。到現在,比較多的是會去想程式的架構怎麼改會比較有效率,以及迴圈的使用上可以如何讓整支程式變得更好,而我付出的努力也會讓自己往後在運用上發揮的更好。

 

二、MYSQL

從大約暑假七月底開始,我們需要將資料匯入資料庫時,我就畫了資料庫的綱目,也順利地建立了資料庫。然而,這之後開始的資料庫輸入卻困擾了我快一個月,先前有做過將資料寫入資料庫的紀錄,但因為這次是預先寫好資料庫,因此花了很多時間在查資料跟不斷的嘗試,最後還是和同組的成員討論過後才開始了輸入的動作,在輸入的過程中,我也不斷的嘗試自己想要的輸入方式,

就是利用資料庫查詢語法先做查詢在插入,因為我認為這樣的方式比較嚴謹且不會額外增加其他問題,在最後也有成功做出自己滿意的成果。

 

三、非技術面學習

剛開始接觸 Python 爬蟲的初期,對這個程式語言還是很陌生,雖然有一本 Python 的書邊做邊看,但是書中寫到相關爬蟲的部分僅僅是帶過而已,所以過程中常常遇到問題。不過,因為自己本身對程式語言也是很有研究精神和興趣的,從開始一直到現在,已經可以看懂許多的寫法,也學會怎麼查詢自己需要的資訊。

 

而遇到編譯錯誤問題時,也從找不出問題而小氣餒到不再去認為自己找不出原因,也會帶著問題去求助身旁的朋友,一起討論如何解決,而且有時課堂上教的只能給你不用過濾的正確的觀念,真正能學到更豐富的內容,卻是在課後自己遇到問題時親自過濾出來的答案以及查詢時延伸的額外資訊。

 

在這個暑假中,我花了大概一個月在找出輸入資料庫的方式,因為同時還有很多事情要做,專題的時間就在不斷撞牆中一直被我默默的壓縮,雖然每次都有一點點的進步,但還是讓我有很長一段時間都很氣餒,然後再繼續找答案跟嘗試。直到有一天,我在寫語法的時候,突然發現我知道怎麼寫了,也就一次花了兩天的時間把過去卡住的問題都解決了,這次的經驗告訴我,即使找不出答案也沒關係,只要有慢慢的、每次都多一點的進步,就很可能哪一天被自己所累積起來的東西所支撐,然後找到自己要的答案。

 

  因此,在這段專題製作期間也意外地發現了以往看待程式碼的編譯錯誤時,思考模式若不正確是會持續在撞牆期的。程式碼無法編譯,固然有語法上或者設定上的錯誤,因此,我們應該要去理解程式在運作上的原理,以及為何它的語法、結構必需是固定的排序,並且把程式碼分段拆解去除錯,這樣一來就可以再次的檢視自己的程式邏輯,也會帶給自己不一樣的看待程式碼的角度。

bottom of page