思想沙龍

Open Data時代來臨 你該怎麼做?

台灣開放資料長期倡議者、科技顧問公司Fertta Communication執行長徐子涵。
李唐峰
第135期
鄭少凡
到底甚麼是開放資料(open data)?
開放資料在社會中有甚麼意義?能帶來甚麼商機?

2009年,美國總統歐巴馬推動了「開放政府前瞻」(Open Government Initiative)的各項作為。此舉在世界造成風潮,各國爭相效仿。

台灣也不例外,台北市、新北市、台中市政府紛紛設立了政府開放資料(open data)網站。去年8月上線的內政部「不動產交易實價查詢服務網」,就是開放資料的實例。

今年4月,台灣中央政府的資料入口網站測試版正式上線,標示著台灣在推動開放資料的重要分水嶺。目前測試版蒐集了中央各部門5筆開放資料,行政院政務委員張善政表示,這是第一波的開放,第二波開放會在今年年底前,要求各政府部門再開放50筆資料放上資料入口網。「民間希望政府部門開放哪些資料,都可在這期間提供意見給各部門。」張善政強調。

到底甚麼是開放資料(open data)?開放資料在社會中有甚麼樣的意義?能帶來甚麼商機?

《看》雜誌專訪了科技顧問公司Fertta Communication執行長徐子涵(在網路上以英文名Schee著稱),他長期在民間推動開放資訊(open data)和開放政府(open government)的政策和研究,對於國際和台灣的開放資訊有著第一手的觀察。

徐子涵的經歷很特別,他挑戰了台灣的教育體制,光是國中就讀了5年。他曾赴澳洲就學,16歲獨自騎重型機車橫越澳洲大陸,因無照駕駛被遣返回台灣。後來保送師大英語系,大一暑假輟學。他獨自騎車環島三次。算一算他總共唸了16所學校,而正式學歷只有高中畢業。

騎重車與獨特的就學經驗,讓徐子涵對「開放」的概念情有獨鍾。

之後,徐子涵選擇網路這個不需學歷背景的領域經營,2001年起投入數位運動;2002年結合國內外同好,將部落格引進華文地區;推動維基百科;在入口網站、中研院、跨國公司、電視台和新創公司擔任管理要職。他曾參與創辦台灣數位文化協會,所發起之計畫包含「胖卡」數位落差車、莫拉克網路災情中心,以及Punch Party數位聚會。

以下即為徐子涵對於「開放資料」相關問題的專業見解。

 

問:甚麼是「開放資料」(open data)?和政府公開資訊的關係是甚麼?

徐:政府有公開資訊(public data),政府把資料上網公開,但上網後民眾找不找得到?公開資訊還可能是特定格式,民眾能不能打開?也就是格式友不友善?

而「開放資料」(open data)就是要將這些政府公開資料轉為「格式自由」與「授權自由」的資料。

格式開放,民眾可以不需用特定軟體就能讀。很重要的是,政府必須允許商業用途,因為以前政府就是不希望民間把資料拿去賣,有很多複雜的法規限制。

 

問:《政府資訊公開法》2005年頒布以來,許多核心資訊都被政府技術性迴避公開,在這情況下,政府的公開資訊足夠民間開放使用嗎?

徐:台灣其實在電子政府來講做得還不錯,而且台灣的IT(網路科技)技術不錯,在網路上有很多政府的公開資料,非常非常地多!連那種用Excel報表做一個網頁丟到網路上的都有。

但因為民情的關係,除了一些緊要的事情像是報稅、繳罰單等情況外,民眾沒有逛政府網站的習慣。由於《政府資訊公開法》的關係,每個政府網站(包括369鄉鎮網站)都有政府資訊公開專區,資料非常多,有很好也有很差的資料。所以由政府公開資訊轉開放資訊來講,台灣的底是夠的。

有個公營當鋪,現在改名為「台北市動產質借處」,台北市每個區都有這公營當鋪標售一些商品,這些資料都有上網,例如之前有一台警方退下來的BMW重型機車標售8萬到15萬塊而已,很划算吧?但一般人不知道這訊息,這資料放出來的管道和時間點只有內行人才知道。

因為之前很多資料大家找不到、格式很難處理,一般人不會去閱讀那資料。現有政府公開資訊開放的話,就會差很多了。

 

問:從2009年美國總統歐巴馬喊出開放政府以來,開放資料成為全世界的風潮,很多國家都在設立開放資料的政府網站,亞洲國家的腳步如何?

徐:新加坡、香港、台灣、日本、韓國都有跟進,大家做的方法都不一樣,台灣是民間最蓬勃的。

香港、新加坡都有政府開放資料入口網站(data.gov),但香港的政府開放資料網站上面沒甚麼資料,大概就只有天氣、交通的資料而已。

新加坡是集權國家,政府放出的資料只能做產業應用,加速巨量數據(Big Data)的科技發展,如政府可以直接監測計程車的行車紀錄:停在哪裡?停多久?然後將這些東西去識別化,開放出來給民間應用後,就可以演算甚麼時間點計程車排班是最多的,進而有交通疏導與流量的應用。他們玩得很快,政府一下令,大家就跟著做,但新加坡不准民間用開放資料做公民監督。

香港近來就很頭大,以前香港的制度跟英國走,公司登記資訊是公開的。現在中國富二代、太子黨很多錢都是從香港跑出去的,特區政府就想把這些資料關起來。民間覺得不可,所以最近有些人聚集開始在討論,和主管機關政府資訊科技總監辦公室(OGCIO)在談。

亞洲國家裡,台灣在推動開放資料的腳步比較健康,不管是由上而下或是由下而上都很強,比較平均一點,只是上下的能量不知如何彼此leverage(發揮槓桿作用)。台灣上面是游擊戰、下面也是游擊戰,所以很活躍,但是開放資料的樣子抓不太出來。

日本跟韓國的做法比較不一樣。日本是亞洲最民主的,人民又信任政府,但是311大地震後,大家拿不到東京電力公司核輻射的資料,民眾都不相信政府了,所以日本在那之後將開放資料的策略整個轉方向,現在雖然沒有架設開放政府資料網站,但他們從每個環節慢慢去做,先研究法規法制,遇到問題一關一關解,看有甚麼單位適合把資料開放出來,然後找學界合作,所以走得很面面俱到、慢慢做上來。政府跟民間、產業合作,是集體戰。

韓國開放資料的腳步是從首爾開始。因為首爾市長是無黨籍的,他甚麼都可以做,所以首爾的開放資料入口網是亞洲做得最棒的,而且做得很早──首爾市的政府開放資料入口網站2010年就上線了。

 

問:4月行政院研考會推出了全國開放資料入口網試用版(data.gov.tw),先蒐集了各部會5筆資料開放,年底要各部會提交至少50筆開放資料,你對這入口網的評價?

徐:以亞洲來講,政府敢宣誓中央等級的開放資料入口網站(data.gov.tw)上線,在政治意義上是巨大的,是很不簡單的。亞洲其他國大概不敢這樣做,這等於是宣告政府政務透明化,這是很難的事情。在這層次上台灣在全球、在亞洲算是快的。

亞洲雖然新加坡、香港有中央等級的開放資料入口網站,但他們都不算正常國家──香港是特區,新加坡是集權,連韓國都沒有中央等級的開放資料入口網站,泰國曾經上線過,但政治壓力太大,六個月就下線了。

至於上線資料的品質和更新速度,這全世界都差不多,一上線資料一定會有很多錯,而且很多沒有用的資料也上線,更新又不即時,美國也一樣。

現在台灣上線的開放資料也很少,總共二百多份,裡面也有一些奇怪的資料,比如說台鐵班車時刻資訊有八十幾萬筆。資料是很多,但我去台鐵網站查就好了,幹嘛放這裡?

另外,五都裡面有三都(台北市、新北市、台中市)已經有資料入口網站,除了台北市之外,其他二都都衝太快,因為沒甚麼資料就上線了,而資料維護又趕不上。

資料是需要維護的,不是放一堆資料之後就沒下文了,首長們想要超英趕美、追上國際風潮是好的,但不瞭解執行端在國外做開放資料背後需要甚麼樣的生態圈──法規、營運、預算層面怎麼處理。

 

問:民間該怎麼看待這些開放資料?

徐:不管是營利事業、非營利事業、媒體、鄉民,透過看政府網站、已經釋放出來的資料去關心公共事務,你會知道國家是怎麼運作的、資源是怎麼分配的、有甚麼機會。這對於民間、對產業來講是一種新的型態,是一種很大的資訊交換文化的變革。

比如環保署公開PM2.5懸浮粒子各個觀測站的資料,還有測站的每5分鐘的觀測截圖,這資料一般人看不懂,到底現在空氣汙染很嚴重嗎?會讓小朋友過敏、氣喘嗎?那就需要有專業的人去解讀。像這樣的原始資料很多,開放這些資料後就可讓一般人獲得,專家可以解讀,或是有興趣的人去找出意義,可以去監督政府、創造新興產業,或是運用到自己的生意,這都是可能的。

或像是政府標案資訊,這本來就是行政院公共工程委員會網站上的公開資料,只是這些資訊的檢索介面讓民眾很難查,不容易看整個全貌,但有好心人把這些資料全部扒出來。

你可以拿去年一整年的標案資料分析,就可發現哪些公司政府標案打擊率最高。一樣按照遊戲規則玩,為何工研院打擊率九成?資策會只有四成五?有些公司一看就很清楚是陪榜公司,因為一年投了三百多個標只中一個?這些資料就很好玩。

另外,我把衛生署公開的醫院名單幾千筆用軟體工具標在台灣地圖上,發現真的在南迴那裡都沒醫院。可能大家大概知道醫療資源不平均,但標在地圖上就造成視覺震撼;還可以疊上人口比例,用醫院分布圖加上人口比例轉成長條圖去看,這樣就可以更精準的與民眾做政策溝通。你用講的民眾沒感覺,但圖一做出來就會很震撼。

一個比較民主的社會才會去關注公共議題,台灣、亞洲大部分國家都比較不敢碰公共事務,都會認為是碰政治,去看資料的話就會發現問題、議題和機會。

至於商機部分,國外已經有一些公司蒐集各國的開放資料,整理成開放資料的倉儲。因為這麼多國家都有開放資料,但是對於想看資料、想買資料的人其實沒有時間去一一看,自然就會有廠商或是網路服務商來當作資料的仲介者,提供給智庫、網路服務商、做App的人等等。

但是台灣因為開放資料量不夠,還沒辦法形成資料的規模經濟去賣,而且台灣在開放資料授權上也有很多不清楚的地方,像是目前開放的二百多筆資料授權方式有二十幾種!授權不清楚就很難應用。

 

問:開放資料(Open Data)和巨量資料(Big Data)的關係是甚麼?

徐:其實這兩者處理資料的層面不一樣。

開放資料處理的是「格式」和「授權」。而巨量資料處理的是:有這麼多複雜、變動這麼快的資料,你要如何交叉運用,比如說在臉書的資料跟消費習性的資料、在哪裡打卡的資料,這種資料是異質性的,怎麼在這麼多資料中快速地找出價值?這就是Big Data!

以實務上來講,巨量資料像是金融、消費資料、悠遊卡、網路上的消費行為,這些資料都不是開放資料。因為這都是企業所擁有的資料,所以跟開放是沒關係的,企業當然可以玩自己的Big Data。

開放資料和巨量資料要有關係的話,應該這麼講:大部分國家裡大量資料的擁有者其實是政府單位,像是氣象是由國家的氣象中心在做。這些國家的資料授權開放出來後,民間就可以用Big Data的技術、模式、應用來將這些資料發展,造成社會的創新。

所以國家如果有資料民主,民間就可以用新的技術創造新的價值。

 

徐子涵小檔案

英文名:T.H. Schee

現任:Fertta Communication 執行長

學歷:高中畢業

經歷

忠泰生活開發股份有限公司網路事業體總監

忠泰生活開發股份有限公司  副執行長室特助

群利科技股份有限公司資深產品經理

三立電視股份有限公司數位內容事業部開發副理

神達電腦股份有限公司行動通訊事業處區域產品經理(台灣、俄羅斯)

中央研究院資訊科學研究所專案經理

蕃薯藤資訊股份有限公司資訊整合服務處副理

顧問

英國開放知識基金會地區大使

奧地利林茲電子藝術大獎(電子社群)國際委員會

聯合國全球地理空間資訊計畫(GGIM)願景小組諮詢顧問

部落格http://blog.schee.info/

你可能會有興趣的文章

簡化漢字陷中華文化傳承於危機!
前任行政院長劉兆玄先前在大學任教之際,有一次到大陸的某個博物館參觀時,把古文物上鐫刻的漢字一字一句都唸出來,使得旁邊的西方遊客大吃一驚:「…
膠彩畫家姚旭燈贈畫南美館 暢談創作之路
姚旭燈,是《日本美術年鑑》評為當代優秀「日本畫」(膠彩畫)畫家的第一位台灣人,當年他受日本政界引薦,赴日讀書作畫才五年而已,…
Unipapa有理百物 門市走進了新客 也走近了常客
取自台語諧音、搭配搞笑影片宣傳的「潮拎阿罵」好神拖,潮起了居家產品美感革新,也潮起了再一波的好神拖銷售力!這是「Unipapa有理百物」…
史上人數最多的一次集體上訪
在中國數以千萬計的上訪案例中,有一樁無疑是最受世界矚目,影響也最深遠的,那就是距今恰滿10年的「4.25」法輪功上訪事件。 歷史的重大轉折…
Burberry 用鳥兒和蜜蜂塗鴉2015 春夏女裝
 Burberry 2015春夏女裝的發表會以歌頌大自然裡的「鳥兒和蜜蜂」為主題。英國詞曲創作歌手James…
大型投銀頻出包 華爾街危機四伏
自從2008年開始的金融海嘯引發經濟大蕭條之後,華爾街的金融業也風光不再。美國的幾大投資銀行不但虧損慘重,金融肥貓爭議也隨之此消彼長,…
中共對台輿論戰 招數大公開
目前流亡澳洲的中國著名法學家、自由作家袁紅冰,於2009年出版時造成轟動的《台灣大劫難》一書中,…
蛻變案例1──魔法: 夢想起飛, 老樹根木工坊變出教育樂園
在學校裡每當下課時,小朋友最喜歡衝到遊戲區玩溜滑梯、搖搖樂、翹翹板等。可是大家可能不知道,這些陪伴很多人度過快樂童年的遊樂器具,大部分都是…