思想沙龍

Open Data時代來臨 你該怎麼做?

台灣開放資料長期倡議者、科技顧問公司Fertta Communication執行長徐子涵。
李唐峰
第135期
鄭少凡
到底甚麼是開放資料(open data)?
開放資料在社會中有甚麼意義?能帶來甚麼商機?

2009年,美國總統歐巴馬推動了「開放政府前瞻」(Open Government Initiative)的各項作為。此舉在世界造成風潮,各國爭相效仿。

台灣也不例外,台北市、新北市、台中市政府紛紛設立了政府開放資料(open data)網站。去年8月上線的內政部「不動產交易實價查詢服務網」,就是開放資料的實例。

今年4月,台灣中央政府的資料入口網站測試版正式上線,標示著台灣在推動開放資料的重要分水嶺。目前測試版蒐集了中央各部門5筆開放資料,行政院政務委員張善政表示,這是第一波的開放,第二波開放會在今年年底前,要求各政府部門再開放50筆資料放上資料入口網。「民間希望政府部門開放哪些資料,都可在這期間提供意見給各部門。」張善政強調。

到底甚麼是開放資料(open data)?開放資料在社會中有甚麼樣的意義?能帶來甚麼商機?

《看》雜誌專訪了科技顧問公司Fertta Communication執行長徐子涵(在網路上以英文名Schee著稱),他長期在民間推動開放資訊(open data)和開放政府(open government)的政策和研究,對於國際和台灣的開放資訊有著第一手的觀察。

徐子涵的經歷很特別,他挑戰了台灣的教育體制,光是國中就讀了5年。他曾赴澳洲就學,16歲獨自騎重型機車橫越澳洲大陸,因無照駕駛被遣返回台灣。後來保送師大英語系,大一暑假輟學。他獨自騎車環島三次。算一算他總共唸了16所學校,而正式學歷只有高中畢業。

騎重車與獨特的就學經驗,讓徐子涵對「開放」的概念情有獨鍾。

之後,徐子涵選擇網路這個不需學歷背景的領域經營,2001年起投入數位運動;2002年結合國內外同好,將部落格引進華文地區;推動維基百科;在入口網站、中研院、跨國公司、電視台和新創公司擔任管理要職。他曾參與創辦台灣數位文化協會,所發起之計畫包含「胖卡」數位落差車、莫拉克網路災情中心,以及Punch Party數位聚會。

以下即為徐子涵對於「開放資料」相關問題的專業見解。

 

問:甚麼是「開放資料」(open data)?和政府公開資訊的關係是甚麼?

徐:政府有公開資訊(public data),政府把資料上網公開,但上網後民眾找不找得到?公開資訊還可能是特定格式,民眾能不能打開?也就是格式友不友善?

而「開放資料」(open data)就是要將這些政府公開資料轉為「格式自由」與「授權自由」的資料。

格式開放,民眾可以不需用特定軟體就能讀。很重要的是,政府必須允許商業用途,因為以前政府就是不希望民間把資料拿去賣,有很多複雜的法規限制。

 

問:《政府資訊公開法》2005年頒布以來,許多核心資訊都被政府技術性迴避公開,在這情況下,政府的公開資訊足夠民間開放使用嗎?

徐:台灣其實在電子政府來講做得還不錯,而且台灣的IT(網路科技)技術不錯,在網路上有很多政府的公開資料,非常非常地多!連那種用Excel報表做一個網頁丟到網路上的都有。

但因為民情的關係,除了一些緊要的事情像是報稅、繳罰單等情況外,民眾沒有逛政府網站的習慣。由於《政府資訊公開法》的關係,每個政府網站(包括369鄉鎮網站)都有政府資訊公開專區,資料非常多,有很好也有很差的資料。所以由政府公開資訊轉開放資訊來講,台灣的底是夠的。

有個公營當鋪,現在改名為「台北市動產質借處」,台北市每個區都有這公營當鋪標售一些商品,這些資料都有上網,例如之前有一台警方退下來的BMW重型機車標售8萬到15萬塊而已,很划算吧?但一般人不知道這訊息,這資料放出來的管道和時間點只有內行人才知道。

因為之前很多資料大家找不到、格式很難處理,一般人不會去閱讀那資料。現有政府公開資訊開放的話,就會差很多了。

 

問:從2009年美國總統歐巴馬喊出開放政府以來,開放資料成為全世界的風潮,很多國家都在設立開放資料的政府網站,亞洲國家的腳步如何?

徐:新加坡、香港、台灣、日本、韓國都有跟進,大家做的方法都不一樣,台灣是民間最蓬勃的。

香港、新加坡都有政府開放資料入口網站(data.gov),但香港的政府開放資料網站上面沒甚麼資料,大概就只有天氣、交通的資料而已。

新加坡是集權國家,政府放出的資料只能做產業應用,加速巨量數據(Big Data)的科技發展,如政府可以直接監測計程車的行車紀錄:停在哪裡?停多久?然後將這些東西去識別化,開放出來給民間應用後,就可以演算甚麼時間點計程車排班是最多的,進而有交通疏導與流量的應用。他們玩得很快,政府一下令,大家就跟著做,但新加坡不准民間用開放資料做公民監督。

香港近來就很頭大,以前香港的制度跟英國走,公司登記資訊是公開的。現在中國富二代、太子黨很多錢都是從香港跑出去的,特區政府就想把這些資料關起來。民間覺得不可,所以最近有些人聚集開始在討論,和主管機關政府資訊科技總監辦公室(OGCIO)在談。

亞洲國家裡,台灣在推動開放資料的腳步比較健康,不管是由上而下或是由下而上都很強,比較平均一點,只是上下的能量不知如何彼此leverage(發揮槓桿作用)。台灣上面是游擊戰、下面也是游擊戰,所以很活躍,但是開放資料的樣子抓不太出來。

日本跟韓國的做法比較不一樣。日本是亞洲最民主的,人民又信任政府,但是311大地震後,大家拿不到東京電力公司核輻射的資料,民眾都不相信政府了,所以日本在那之後將開放資料的策略整個轉方向,現在雖然沒有架設開放政府資料網站,但他們從每個環節慢慢去做,先研究法規法制,遇到問題一關一關解,看有甚麼單位適合把資料開放出來,然後找學界合作,所以走得很面面俱到、慢慢做上來。政府跟民間、產業合作,是集體戰。

韓國開放資料的腳步是從首爾開始。因為首爾市長是無黨籍的,他甚麼都可以做,所以首爾的開放資料入口網是亞洲做得最棒的,而且做得很早──首爾市的政府開放資料入口網站2010年就上線了。

 

問:4月行政院研考會推出了全國開放資料入口網試用版(data.gov.tw),先蒐集了各部會5筆資料開放,年底要各部會提交至少50筆開放資料,你對這入口網的評價?

徐:以亞洲來講,政府敢宣誓中央等級的開放資料入口網站(data.gov.tw)上線,在政治意義上是巨大的,是很不簡單的。亞洲其他國大概不敢這樣做,這等於是宣告政府政務透明化,這是很難的事情。在這層次上台灣在全球、在亞洲算是快的。

亞洲雖然新加坡、香港有中央等級的開放資料入口網站,但他們都不算正常國家──香港是特區,新加坡是集權,連韓國都沒有中央等級的開放資料入口網站,泰國曾經上線過,但政治壓力太大,六個月就下線了。

至於上線資料的品質和更新速度,這全世界都差不多,一上線資料一定會有很多錯,而且很多沒有用的資料也上線,更新又不即時,美國也一樣。

現在台灣上線的開放資料也很少,總共二百多份,裡面也有一些奇怪的資料,比如說台鐵班車時刻資訊有八十幾萬筆。資料是很多,但我去台鐵網站查就好了,幹嘛放這裡?

另外,五都裡面有三都(台北市、新北市、台中市)已經有資料入口網站,除了台北市之外,其他二都都衝太快,因為沒甚麼資料就上線了,而資料維護又趕不上。

資料是需要維護的,不是放一堆資料之後就沒下文了,首長們想要超英趕美、追上國際風潮是好的,但不瞭解執行端在國外做開放資料背後需要甚麼樣的生態圈──法規、營運、預算層面怎麼處理。

 

問:民間該怎麼看待這些開放資料?

徐:不管是營利事業、非營利事業、媒體、鄉民,透過看政府網站、已經釋放出來的資料去關心公共事務,你會知道國家是怎麼運作的、資源是怎麼分配的、有甚麼機會。這對於民間、對產業來講是一種新的型態,是一種很大的資訊交換文化的變革。

比如環保署公開PM2.5懸浮粒子各個觀測站的資料,還有測站的每5分鐘的觀測截圖,這資料一般人看不懂,到底現在空氣汙染很嚴重嗎?會讓小朋友過敏、氣喘嗎?那就需要有專業的人去解讀。像這樣的原始資料很多,開放這些資料後就可讓一般人獲得,專家可以解讀,或是有興趣的人去找出意義,可以去監督政府、創造新興產業,或是運用到自己的生意,這都是可能的。

或像是政府標案資訊,這本來就是行政院公共工程委員會網站上的公開資料,只是這些資訊的檢索介面讓民眾很難查,不容易看整個全貌,但有好心人把這些資料全部扒出來。

你可以拿去年一整年的標案資料分析,就可發現哪些公司政府標案打擊率最高。一樣按照遊戲規則玩,為何工研院打擊率九成?資策會只有四成五?有些公司一看就很清楚是陪榜公司,因為一年投了三百多個標只中一個?這些資料就很好玩。

另外,我把衛生署公開的醫院名單幾千筆用軟體工具標在台灣地圖上,發現真的在南迴那裡都沒醫院。可能大家大概知道醫療資源不平均,但標在地圖上就造成視覺震撼;還可以疊上人口比例,用醫院分布圖加上人口比例轉成長條圖去看,這樣就可以更精準的與民眾做政策溝通。你用講的民眾沒感覺,但圖一做出來就會很震撼。

一個比較民主的社會才會去關注公共議題,台灣、亞洲大部分國家都比較不敢碰公共事務,都會認為是碰政治,去看資料的話就會發現問題、議題和機會。

至於商機部分,國外已經有一些公司蒐集各國的開放資料,整理成開放資料的倉儲。因為這麼多國家都有開放資料,但是對於想看資料、想買資料的人其實沒有時間去一一看,自然就會有廠商或是網路服務商來當作資料的仲介者,提供給智庫、網路服務商、做App的人等等。

但是台灣因為開放資料量不夠,還沒辦法形成資料的規模經濟去賣,而且台灣在開放資料授權上也有很多不清楚的地方,像是目前開放的二百多筆資料授權方式有二十幾種!授權不清楚就很難應用。

 

問:開放資料(Open Data)和巨量資料(Big Data)的關係是甚麼?

徐:其實這兩者處理資料的層面不一樣。

開放資料處理的是「格式」和「授權」。而巨量資料處理的是:有這麼多複雜、變動這麼快的資料,你要如何交叉運用,比如說在臉書的資料跟消費習性的資料、在哪裡打卡的資料,這種資料是異質性的,怎麼在這麼多資料中快速地找出價值?這就是Big Data!

以實務上來講,巨量資料像是金融、消費資料、悠遊卡、網路上的消費行為,這些資料都不是開放資料。因為這都是企業所擁有的資料,所以跟開放是沒關係的,企業當然可以玩自己的Big Data。

開放資料和巨量資料要有關係的話,應該這麼講:大部分國家裡大量資料的擁有者其實是政府單位,像是氣象是由國家的氣象中心在做。這些國家的資料授權開放出來後,民間就可以用Big Data的技術、模式、應用來將這些資料發展,造成社會的創新。

所以國家如果有資料民主,民間就可以用新的技術創造新的價值。

 

徐子涵小檔案

英文名:T.H. Schee

現任:Fertta Communication 執行長

學歷:高中畢業

經歷

忠泰生活開發股份有限公司網路事業體總監

忠泰生活開發股份有限公司  副執行長室特助

群利科技股份有限公司資深產品經理

三立電視股份有限公司數位內容事業部開發副理

神達電腦股份有限公司行動通訊事業處區域產品經理(台灣、俄羅斯)

中央研究院資訊科學研究所專案經理

蕃薯藤資訊股份有限公司資訊整合服務處副理

顧問

英國開放知識基金會地區大使

奧地利林茲電子藝術大獎(電子社群)國際委員會

聯合國全球地理空間資訊計畫(GGIM)願景小組諮詢顧問

部落格http://blog.schee.info/

你可能會有興趣的文章

雅虎支持谷歌 惹惱阿里巴巴
搜索引擎巨擘谷歌由於駭客入侵維權人士的電子信箱帳戶以及中國日益嚴格的審查制度,聲稱將考慮撤離中國大陸。1月13日,雅虎(yahoo)…
亞典蛋糕密碼館 烘焙「五心級」蛋糕
一般人聽到獨家、祕辛,總會好奇想一探究竟。您如果聽到「蛋糕密碼」是否也會睜大眼睛想來瞧瞧這是「瞎米碗糕」? 免費試吃探索蛋糕密碼 每到假日…
台灣十大絕美步道之一 花蓮瓦拉米步道
山明水秀,風光旖旎,台灣「東大門」花蓮以自然觀光資源聞名。秋冬季泡湯趣,「花蓮太平洋溫泉季」連續四年舉辦,佳評如潮。「瑞穗英雄泉」、「…
信用卡的魔鬼細節
▲YouTube影音 預支信用小心養成透支習慣!年輕人如何修心存錢? 主持人安慈:現在大家出門一般都會帶錢包、手機、鑰匙,…
海外中概股處境維艱 首富傳退市
近日,在美國上市的多家中國公司處境不佳、準備退市。而在香港上市的中國企業本益比(指每股市價除以每股盈利,中國稱「市盈率」)遠低於本地企業,…
歸宿
以前,女孩子出嫁,我們恭喜她找到了一個「歸宿」。後來,歸宿二字裡的傳統涵義被推翻,除了社會變遷,女性經濟能力提高帶動了一連串的改變,…
與天體對應 人體穴位奧祕無窮
中國的道家講究天人合一,認為人與宇宙是一個有機的整體。人體本身就是一個小宇宙,遍布在人體中的穴位,就像宇宙中有序排列的星體一樣,…
「坦克車上陣」對付日全食?
中國古人相信,天象的出現,表示人間的吉凶禍福;觀察天象變化,可以用來察看時勢的變化。因此,歷朝歷代的統治者對天象都是很敬畏的。…