思想沙龍

Open Data时代来临 你该怎么做?

台湾开放资料长期倡议者、科技顾问公司Fertta Communication执行长徐子涵。
李唐峰
第135期
郑少凡
到底甚么是开放资料(open data)?
开放资料在社会中有甚么意义?能带来甚么商机?

2009年,美国总统欧巴马推动了「开放政府前瞻」(Open Government Initiative)的各项作为。此举在世界造成风潮,各国争相效仿。

台湾也不例外,台北市、新北市、台中市政府纷纷设立了政府开放资料(open data)网站。去年8月上线的内政部「不动产交易实价查询服务网」,就是开放数据的实例。

今年4月,台湾中央政府的资料入口网站测试版正式上线,标示着台湾在推动开放资料的重要分水岭。目前测试版搜集了中央各部门5笔开放资料,行政院政务委员张善政表示,这是第一波的开放,第二波开放会在今年年底前,要求各政府部门再开放50笔数据放上数据入口网。「民间希望政府部门开放哪些资料,都可在这期间提供意见给各部门。」张善政强调。

到底甚么是开放资料(open data)?开放资料在社会中有甚么样的意义?能带来甚么商机?

《看》杂志专访了科技顾问公司Fertta Communication执行长徐子涵(在网络上以英文名Schee著称),他长期在民间推动开放信息(open data)和开放政府(open government)的政策和研究,对于国际和台湾的开放信息有着第一手的观察。

徐子涵的经历很特别,他挑战了台湾的教育体制,光是国中就读了5年。他曾赴澳洲就学,16岁独自骑重型机车横越澳洲大陆,因无照驾驶被遣返回台湾。后来保送师大英语系,大一暑假辍学。他独自骑车环岛三次。算一算他总共念了16所学校,而正式学历只有高中毕业。

骑重车与独特的就学经验,让徐子涵对「开放」的概念情有独钟。

之后,徐子涵选择网络这个不需学历背景的领域经营,2001年起投入数字运动;2002年结合国内外同好,将部落格引进华文地区;推动维基百科;在入口网站、中研院、跨国公司、电视台和新创公司担任管理要职。他曾参与创办台湾数字文化协会,所发起之计划包含「胖卡」数字落差车、莫拉克网络灾情中心,以及Punch Party数字聚会。

以下即为徐子涵对于「开放资料」相关问题的专业见解。

 

问:甚么是「开放资料」(open data)?和政府公开信息的关系是甚么?

徐:政府有公开信息(public data),政府把资料上网公开,但上网后民众找不找得到?公开信息还可能是特定格式,民众能不能打开?也就是格式友不友善?

而「开放数据」(open data)就是要将这些政府公开数据转为「格式自由」与「授权自由」的数据。

格式开放,民众可以不需用特定软件就能读。很重要的是,政府必须允许商业用途,因为以前政府就是不希望民间把资料拿去卖,有很多复杂的法规限制。

 

问:《政府信息公开法》2005年颁布以来,许多核心信息都被政府技术性回避公开,在这情况下,政府的公开信息足够民间开放使用吗?

徐:台湾其实在电子政府来讲做得还不错,而且台湾的IT(网络科技)技术不错,在网络上有很多政府的公开数据,非常非常地多!连那种用Excel报表做一个网页丢到网络上的都有。

但因为民情的关系,除了一些紧要的事情像是报税、缴罚单等情况外,民众没有逛政府网站的习惯。由于《政府信息公开法》的关系,每个政府网站(包括369乡镇网站)都有政府信息公开专区,数据非常多,有很好也有很差的资料。所以由政府公开信息转开放信息来讲,台湾的底是够的。

有个公营当铺,现在改名为「台北市动产质借处」,台北市每个区都有这公营当铺标售一些商品,这些数据都有上网,例如之前有一台警方退下来的BMW重型机车标售8万到15万块而已,很划算吧?但一般人不知道这讯息,这数据放出来的管道和时间点只有内行人才知道。

因为之前很多数据大家找不到、格式很难处理,一般人不会去阅读那数据。现有政府公开信息开放的话,就会差很多了。

 

问:从2009年美国总统欧巴马喊出开放政府以来,开放资料成为全世界的风潮,很多国家都在设立开放资料的政府网站,亚洲国家的脚步如何?

徐:新加坡、香港、台湾、日本、韩国都有跟进,大家做的方法都不一样,台湾是民间最蓬勃的。

香港、新加坡都有政府开放资料入口网站(data.gov),但香港的政府开放数据网站上面没甚么数据,大概就只有天气、交通的资料而已。

新加坡是集权国家,政府放出的数据只能做产业应用,加速巨量数据(Big Data)的科技发展,如政府可以直接监测出租车的行车纪录:停在哪里?停多久?然后将这些东西去识别化,开放出来给民间应用后,就可以演算甚么时间点出租车排班是最多的,进而有交通疏导与流量的应用。他们玩得很快,政府一下令,大家就跟着做,但新加坡不准民间用开放资料做公民监督。

香港近来就很头大,以前香港的制度跟英国走,公司登记信息是公开的。现在中国富二代、太子党很多钱都是从香港跑出去的,特区政府就想把这些资料关起来。民间觉得不可,所以最近有些人聚集开始在讨论,和主管机关政府资讯科技总监办公室(OGCIO)在谈。

亚洲国家里,台湾在推动开放资料的脚步比较健康,不管是由上而下或是由下而上都很强,比较平均一点,只是上下的能量不知如何彼此leverage(发挥杠杆作用)。台湾上面是游击战、下面也是游击战,所以很活跃,但是开放数据的样子抓不太出来。

日本跟韩国的做法比较不一样。日本是亚洲最民主的,人民又信任政府,但是311大地震后,大家拿不到东京电力公司核辐射的资料,民众都不相信政府了,所以日本在那之后将开放资料的策略整个转方向,现在虽然没有架设开放政府资料网站,但他们从每个环节慢慢去做,先研究法规法制,遇到问题一关一关解,看有甚么单位适合把数据开放出来,然后找学界合作,所以走得很面面俱到、慢慢做上来。政府跟民间、产业合作,是集体战。

韩国开放资料的脚步是从首尔开始。因为首尔市长是无党籍的,他甚么都可以做,所以首尔的开放数据入口网是亚洲做得最棒的,而且做得很早──首尔市的政府开放资料入口网站2010年就上线了。

 

问:4月行政院研考会推出了全国开放资料入口网试用版(data.gov.tw),先搜集了各部会5笔资料开放,年底要各部会提交至少50笔开放资料,你对这入口网的评价?

徐:以亚洲来讲,政府敢宣誓中央等级的开放数据入口网站(data.gov.tw)上线,在政治意义上是巨大的,是很不简单的。亚洲其他国大概不敢这样做,这等于是宣告政府政务透明化,这是很难的事情。在这层次上台湾在全球、在亚洲算是快的。

亚洲虽然新加坡、香港有中央等级的开放数据入口网站,但他们都不算正常国家──香港是特区,新加坡是集权,连韩国都没有中央等级的开放数据入口网站,泰国曾经上线过,但政治压力太大,六个月就下线了。

至于上线数据的质量和更新速度,这全世界都差不多,一上线数据一定会有很多错,而且很多没有用的数据也上线,更新又不实时,美国也一样。

现在台湾上线的开放资料也很少,总共二百多份,里面也有一些奇怪的数据,比如说台铁班车时刻信息有八十几万笔。资料是很多,但我去台铁网站查就好了,干嘛放这里?

另外,五都里面有三都(台北市、新北市、台中市)已经有数据入口网站,除了台北市之外,其他二都都冲太快,因为没甚么数据就上线了,而数据维护又赶不上。

数据是需要维护的,不是放一堆数据之后就没下文了,首长们想要超英赶美、追上国际风潮是好的,但不了解执行端在国外做开放数据背后需要甚么样的生态圈──法规、营运、预算层面怎么处理。

 

问:民间该怎么看待这些开放资料?

徐:不管是营利事业、非营利事业、媒体、乡民,透过看政府网站、已经释放出来的数据去关心公共事务,你会知道国家是怎么运作的、资源是怎么分配的、有甚么机会。这对于民间、对产业来讲是一种新的型态,是一种很大的信息交换文化的变革。

比如环保署公开PM2.5悬浮粒子各个观测站的数据,还有测站的每5分钟的观测截图,这数据一般人看不懂,到底现在空气污染很严重吗?会让小朋友过敏、气喘吗?那就需要有专业的人去解读。像这样的原始资料很多,开放这些资料后就可让一般人获得,专家可以解读,或是有兴趣的人去找出意义,可以去监督政府、创造新兴产业,或是运用到自己的生意,这都是可能的。

或像是政府标案信息,这本来就是行政院公共工程委员会网站上的公开数据,只是这些信息的检索接口让民众很难查,不容易看整个全貌,但有好心人把这些资料全部扒出来。

你可以拿去年一整年的标案数据分析,就可发现哪些公司政府标案打击率最高。一样按照游戏规则玩,为何工研院打击率九成?资策会只有四成五?有些公司一看就很清楚是陪榜公司,因为一年投了三百多个标只中一个?这些资料就很好玩。

另外,我把卫生署公开的医院名单几千笔用软件工具标在台湾地图上,发现真的在南回那里都没医院。可能大家大概知道医疗资源不平均,但标在地图上就造成视觉震撼;还可以迭上人口比例,用医院分布图加上人口比例转成直方图去看,这样就可以更精准的与民众做政策沟通。你用讲的民众没感觉,但图一做出来就会很震撼。

一个比较民主的社会才会去关注公共议题,台湾、亚洲大部分国家都比较不敢碰公共事务,都会认为是碰政治,去看资料的话就会发现问题、议题和机会。

至于商机部分,国外已经有一些公司搜集各国的开放数据,整理成开放数据的仓储。因为这么多国家都有开放数据,但是对于想看数据、想买数据的人其实没有时间去一一看,自然就会有厂商或是网络服务商来当作数据的中介者,提供给智库、网络服务商、做App的人等等。

但是台湾因为开放资料量不够,还没办法形成数据的规模经济去卖,而且台湾在开放资料授权上也有很多不清楚的地方,像是目前开放的二百多笔数据授权方式有二十几种!授权不清楚就很难应用。

 

问:开放数据(Open Data)和巨量资料(Big Data)的关系是甚么?

徐:其实这两者处理数据的层面不一样。

开放数据处理的是「格式」和「授权」。而巨量数据处理的是:有这么多复杂、变动这么快的数据,你要如何交叉运用,比如说在脸书的数据跟消费习性的数据、在哪里打卡的数据,这种数据是异质性的,怎么在这么多数据中快速地找出价值?这就是Big Data!

以实务上来讲,巨量资料像是金融、消费数据、悠游卡、网络上的消费行为,这些数据都不是开放数据。因为这都是企业所拥有的数据,所以跟开放是没关系的,企业当然可以玩自己的Big Data。

开放数据和巨量数据要有关系的话,应该这么讲:大部分国家里大量资料的拥有者其实是政府单位,像是气象是由国家的气象中心在做。这些国家的资料授权开放出来后,民间就可以用Big Data的技术、模式、应用来将这些数据发展,造成社会的创新。

所以国家如果有资料民主,民间就可以用新的技术创造新的价值。

 

徐子涵小档案

英文名:T.H. Schee

现任:Fertta Communication 执行长

学历:高中毕业

经历

忠泰生活开发股份有限公司网络事业体总监

忠泰生活开发股份有限公司  副执行长室特助

群利科技股份有限公司资深产品经理

三立电视股份有限公司数字内容事业部开发副理

神达计算机股份有限公司行动通讯事业处区域产品经理(台湾、俄罗斯)

中央研究院信息科学研究所项目经理

蕃薯藤信息股份有限公司信息整合服务处副理

顾问

英国开放知识基金会地区大使

奥地利林兹电子艺术大奖(电子社群)国际委员会

联合国全球地理空间信息计划(GGIM)愿景小组咨询顾问

部落格:http://blog.schee.info/

你可能會有興趣的文章

六四在香港20週年
由於六四給香港人造成的震撼,每年六四,政壇總會把六四當作話題。 香港主權轉移以後,除了第一年因為立法會泛民議員不能直通而無法出聲外,…
十面「霾」伏 「北京咳」肆虐大半中國
對肺部極具傷害的「爆表」級霧霾近日籠罩半個中國,讓淪為「人肉吸塵器」的中國百姓非常憤怒。英國媒體甚至諷刺稱,北京的空氣汙染「比糟糕透頂更糟…
兆豐銀醜聞和私有化出路
「兆豐銀行」紐約分行因違反洗錢法被美國紐約州金融署開罰57億台幣,再次引起公股銀行民營化的討論。Thinkstock 台灣「…
守護一甲子「涼粉伯」 萬華女兒辜凱鈴致力振興老城
初次造訪萬華,途經香煙裊裊的龍山寺,迥異於現代化的台北城印象,此處不見大都會的喧囂雜沓,取而代之的是滿街台語的中南部氛圍。生活步調緩慢,…
解讀青春密碼
殺人的是時代──《牯嶺街少年殺人事件》(A Brighter Summer Day)(舊片) 導演:楊德昌演員:張國柱、張震、…
危機 碰到「藝術俠女」也讓路
喜歡藝術的人,對「美」,有自己的想法與鑑賞力,更重要的是有一顆容易感動、為他人著想的心。不過,看似「化指柔」的藝術特質,在遇到困難時,…
我與我的中古車
「啥?你花新車的錢,去買中古車!還是小眾品牌!」 望著共事的表弟與同仁疑惑的眼神,原本雀躍的心情,瞬間跌入谷裡。此時我理智起來,…
歡迎回家 走進好茶部落接待家庭
前往屏東「禮納里」時已近傍晚,斜陽染紅綿延山邊的歐式建築。拖著長長的身影,我們踏上傳統的石板地,大武山的風吹散了南台灣12月的燠熱。…