跳到主要內容區塊

在地化Localization

地方政府開放資料常見問題-資料面

2017-02-22
滑動icon以下表格可左右滑動,瀏覽內容

問題

解答

政府資料開放和政府資訊公開有何不同?

為便利人民共享及公平利用政府資訊,政府於民國94年頒定「政府資訊公開法」,明定與人民權益攸關之施政、措施及其它有關之政府資訊,以主動公開為原則並應適時為之,期透過施政之公開與透明,保障人民知的權利,增進人民對公共事務之瞭解、信賴促進民主之參與。資訊公開的方式包含刊載於政府機關公報或其他出版品、提供線上查詢、舉行記者會或說明會、提供公開閱覽、抄錄影印等。

配合資通訊科技的發展進步,除了資訊公開外,各國逐漸推動資料開放,「政府資料開放」(Open Government Data)就是由政府機構將其所持有的大量資料進行數位化後,以資料集 (dataset) 為基本單位採開放格式存置於固定網址,讓所有民眾都可以透過網際網路搜尋並取得所需資料,讓民眾在不受到限制的情形下,進行編輯、分析、公開傳輸或為其他利用方式,開發各種產品或應用服務,滿足民眾「用」的「權益」。

舉例來說,您可以到政府開放資料平臺
(點選前往瀏覽)去尋找您所需要的資料集。

為什麼要推動政府資料開放?有什麼好處?

民眾為參與公共政策過程、監督政府施政作為或從事各項經濟活動,有賴大量且正確之資料,而政府正是各項資料的最大擁有者。將政府資料開放供民間自由取用已蔚為國際趨勢,藉由政府資料的開放,滿足民眾資料使用需求,促使跨機關資料流通,增進施政效能,提升民眾生活品質,強化民眾監督政府的力量。

 

此外政府資料開放可結合民間無限創意,活化政府資料應用,能更進一步提升政府資料品質及價值,進而創新政府服務,並透過開放授權民間應用,創造資訊服務產業發展契機,期達成增進施政透明開放、提升機關決策品質、發展多元便民服務及助益資訊產業轉型等效益,創造民眾、政府與業界三贏局面。

政府資料開放須依據甚麼原則?

政府資料開放之範圍,為各機關於職權範圍內取得或做成,且依法得公開之各類電子資料,包含文字、數據、圖片、影像、聲音、詮釋資料(metadata)等。

 

各機關以無償提供為原則。但有特殊業務需求者,得約定收費方式及金額,並定期檢討該約定;其收費,並得依資料使用目的或使用模式約定不同費率。

相關規定,詳見:行政院及所屬各級機關政府資料開放作業原則(點選前往瀏覽)

如何訂定開放資料行動計畫(action plan)?

自2012年起,行政院所屬各機關以「資料開放民眾與企業運用」、「以免費為原則、收費為例外」、「資料大量、自動化而有系統的釋放與交換」3步驟,並配合「主動開放,民生優先」、「制定開放資料規範」、「推動共用平臺(Data.gov.tw)」、「示範宣導及服務推廣」等4大焦點策略循序推動政府資料開放工作。

 

而長期以來我國地方政府與民間應用鏈結較於薄弱,為突破此問題,建議建立政府資料開放諮詢機制,加速資料開放;並推動法規鬆綁及提升資料品質,建構開放環境,其相關執行做法,可參考:

  1. 政府資料開放行動計畫:http://beta.join.gov.tw/book/zheng_fu_zi_liao_kai_fang.html
  2. 政府資料開放進階行動方案:http://www.ndc.gov.tw/Content_List.aspx?n=B2A92523DCC12607
  3. 行政院所屬各二級機關「開放具體行動計畫」

http://www.dgbas.gov.tw/public/data/open/InfoM/M/Plans-of-Action.pdf

此外,另外可以參考國外一些案例

  1. UK Open Government National Action Plan 2016 to 2018

https://www.gov.uk/government/publications/uk-open-government-national-action-plan-2016-18

    2.  US Obama gov: U.S. OPEN DATA ACTION PLAN

https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/us_open_data_action_plan.pdf

要開放那些資料才符合民間需求?

建議可以參考政府開放資料平台瀏覽數、下載數最多的資料集(http://data.gov.tw/data_usage/dataset?order=totalcount&sort=desc),如:不動產買賣實價登錄批次資料勞工體格及健康檢查認可醫療機構CNS11643中文標準交換碼全字庫(簡稱全字庫)行政院所屬中央及地方機關代碼空氣品質即時污染指標中央氣象局雨量站觀測資料鐵路時刻表鄉鎮市區界線(TWD97經緯度)等,瀏覽數、下載數多可以發現與民生及民間需求量較為相關。

但其實政府機關平常在做業務資料,就是民間需求了,千萬不可以量為指標來看,而是要思考平常的業務資料,如何進行開放,便即可符合國民需求。

中央政府已經開放的資料,地方政府還需要開放嗎?

可以中央與地方合作、協調後,然後進行開放;也可以中央、地方均開放,由取用人自行選擇。這兩者的資料開放流程、行政作業、資源配置以及之後取得的績效都會不一樣,地方政府應多思考如何跟中央政府競合,如何讓國民多信賴自己的單位,而開放資料是一個很好的方式。

資料格式欄位與語意問題各地都不統一,請問應如何兼顧資料開放及資料格式欄位、語意之問題?

建議先求至少完成基本的開放資料,格式、語意等統一,需要的是有單位、組織或人們,出來帶頭與協調完成的。如果該單位已經做好開放資料,如果進而要優化自己的欄位、語意等,這過程會產生標準語規範,此時可以當成領先者,帶領其他單位將這件事情做好,制定統一的標準,建議可以參考以下資料:

  1. Web3.0 語意網新趨勢 ─ 與TELDAP之實作應用http://ebook.teldap.tw/ebook_detail.jsp?id=176
  2. US data.gov 的 SEMANTIC WEB https://www.data.gov/semantic.
  3. W3C semantic web https://www.w3.org/standards/semanticweb/data

各資料集是否有建議詮釋資料參考,否則各地皆不統一,民眾也難以尋找

針對建議詮釋資料格式,政府開放資料平台(http://data.gov.tw)提供『資料集詮釋資料標準規範』供資料提供單位有足夠的詮釋資料描述資料集特性。詳細內容請參考資料集詮釋資料標準規範網頁文件( http://data.gov.tw/node/18252 )

 

此外,在增進民眾查找開放資料便利度上,可以參考政府開放資料平台(http://data.gov.tw)的『政府資料開放跨平臺介接規範』,該介接規範允許資料串連發布至「政府資料開放平臺」,以利資料集之散佈與傳遞。該規範提供發布應用方式如下:

  1. 不同資料開放平臺的詮釋資料可更新至「政府資料開放平臺」。提供「政府資料開放平臺」擷取「詮釋資料提供平臺」所發布之詮釋資料、或由「詮釋資料提供平臺」主動發布詮釋資料至「政府資料開放平臺」。
  2. 「詮釋資料需求平臺」取得其他機關資料集詮釋資料。「詮釋資料需求平臺」可透過「政府資料開放平臺」擷取「詮釋資料提供平臺」所發布之詮釋資料,並同步更新之前所取得的其他機關資料集詮釋資料,達到任一機關單一資料集詮釋資料可更新至多個資料開放平臺。

詳細資料請參考『政府資料開放跨平臺介接規範』網站資訊:http://data.gov.tw/node/18254

甚麼是詮釋資料?如何制定?有相關參考的做法嗎?

詮釋資料(Metadata)是描述資料的資料,幫助使用者辨識、描述,及定位資訊(包括電子資訊及非電子資訊),又稱描述性資料、元資料、中介資料等。例如,圖書館的「圖書資料庫系統」便是一種詮釋資料(庫),它紀錄了圖書館內所有圖書的書名、作者、出版者等相關資料。每一本書的目錄也是一種詮釋資料,它描述各章節(資料)的標題。詮釋資料庫通常搭配「檢索系統」,供人很容易找到所需的資料。

詮釋資料庫涉及許多專業領域知識,行政院104年7月公布「資料集詮釋資料標準規範」,希望(1)各政府單位以該規範之通用性資料集標準框架為基礎,發展符合部門業務之詮釋資料標準內容,讓各資料提供者有足夠的詮釋資料描述資料集特性;(2)方便資料使用者便利、有效、快速地找到所需的政府開放資料,以達成跨機關各類資訊資源交換作業及資料加值應用。

 

該規範中詳述:資料集詮釋資料之類別、通用性資料集標準框架及綱要、欄位詳細說明(包括詮釋資料欄位基本規定、資料型態、欄位定義等),以及標準規範範例。可以參考該規範中的制定方法及範例,製作屬於自己單位的詮釋資料及標準。

政府資料分成甲類、乙類、丙類清單,是以甚麼作為區分?該開放哪類的資料?

政府開放資料政策實施以來,各機關資料可不可以開放?需不需要收費?等議題眾說紛紜;且於大數據分析時代,政府也需整合跨部門、跨部會等資料,來作大數據分析,以為政策決策之依據;但部門、部會間的資料應不應相互開放?如何開放?要不要收費?涉及機密資料時資料擺放位置如何?也是眾說紛紜。然而,大時代的巨輪持續滾動著,今日不做,明日將遠遠被人民拋棄。

 

因此,行政院104年11月公布「行政院及所屬各機關政府資料分類及授權利用收費原則」,希望作為政府資料之分類,及以民事契約約定其授權利用之收費項目之依據,以擴大推廣政府資料活化應用。

該規範第三條,政府資料之類型可區分為甲類、乙類、丙類資料。

甲類資料就是一般所謂的開放資料,是可以開放給大眾無償、可再轉授權的使用。政府所有的資料基本以開放為原則,但若建置成本達一定金額者,得提報行政院資料開放諮詢小組審核後,始得列為甲類資料。

乙類資料為有限度利用資料,指以開放格式提供,且符合下列條件之一者:有償提供、保留撤回權、其他限制條件授權利用。

丙類資料為不開放資料,指依法律規定不得開放、因資料敏感或有其他特殊情形,經各機關首長核可不予開放者。

有許多資料集使用度低,如此該資料集還有必要開放嗎?

依行政院104年11月公布「行政院及所屬各機關政府資料分類及授權利用收費原則」的甲類資料定義:即開放資料,指以開放格式提供,且以無償方式、不可撤回,並得再轉授權方式授權利用為原則者。

 

已開放的資料是不可撤回的,即使用度低,既然已經開放,就不得撤回了。

 

基本上,政府將既存的資料開放,讓民眾或產業能結合其創意,發揮最大應用效益。若釋出的資料集使用度低,則可思考,是否資料集本身的品質無法被民眾方便使用?是否民眾尚未想到好的應用?或者民眾不知道怎麼應用?或者還需其他部會的資料釋出?等。修改資料品質或提示民眾可能的應用都是可行的作法。

對於地方政府而言,開放資料的誘因是甚麼?

根據國發會的開放資料平台文章(https://data.gov.tw/node/1463)提到,推廣開放資料的原因,是基於民眾為參與公共政策過程、監督政府施政作為或從事各項經濟活動,有賴大量且正確之資料,而政府正是各項資料的最大擁有者。而且,將政府資料開放供民間自由取用,已蔚為國際趨勢,期藉由政府資料的開放,可帶來的益處,可廣義的包括對政府端的好處以及對人民與企業的好處:

  • 對資料提供端(政府)的好處:
  1. 促使跨機關資料流通,
  2. 增進施政效能,
  3. 提升政府資料品質及價值,
  4. 創新政府服務,
  5. 活化政府資料應用。
  • 對資料使用端(人民與企業)的好處:
  1. 滿足資料使用者對資料使用需求,
  2. 強化民眾監督政府的力量。
  3. 提升民眾生活品質,
  4. 結合資料使用者無限創意,
  5. 創造資訊服務產業發展契機

綜合上述益處,開放資料可預期的能帶來增進施政透明開放、提升機關決策品質、發展多元便民服務及助益資訊產業轉型等效益,創造民眾、政府、業界三贏局面。

 

引用高雄市政府資訊中心的劉俊傑主任曾提到:為什麼要把資料開放出來?因為民眾會用這些資料,有時候反而是減少政府同仁的負擔。有的時候民眾、社群幫我們做了一些應用服務,我們就不用重複人力或資源在上面。政府只要把那些資料丟出去,就會有很多人幫我們把這些對外服務的事情做好。

若自己本身沒有開放資料平台,可以開放到國發會平台(https://data.gov.tw/),那請問要如何開放?是否有簡單的SOP流程可以提供參考?

國發會平台的【上傳流程】

  1. 註冊成為會員→要上傳的資料集送審至資料審查方(系統會發送「資料集新增送審通知信」給審查者)→審查方會檢視資料集內容並填寫審查意見→通過→寄回「資料審查通過」通知信→依照上架日期於前台露出
  2. 註冊成為會員→要上傳的資料集送審至資料審查方(系統會發送「資料集新增送審通知信」給審查者)→審查方會檢視資料集內容並填寫審查意見→不通過→寄回資料集審查退回通知信→修改資料集→重複上傳的動作

 

國發會平台的【後臺系統管理說明】

  1. 在瀏覽器輸入後臺網址 http://cms.data.gov.tw,點選「確定」按鈕,進入我的 e 政府會員登入網頁。
  2. 請輸入您在我的 e 政府會員的公務帳號,登入成功即可進行後臺進相關 功能的使用,若尚未申請我的 e 政府會員,請連結至 https://www.cp.gov.tw/portal/person/initial/Registry.aspx 進 行申請,並須申請轉為公務帳號。
  3. 登入成功後,即進入後臺管理介面。

 

【備註】詳細上傳流程可參考國發會提供的「政府資料開放平臺_後臺管理系統操作手冊」(http://file.data.gov.tw/event/Manual_v2.pdf)。上傳時若遇上資料集詮釋問題,也可參考國發會提供的「資料集詮釋資料標準規範」(https://data.gov.tw/node/18252),裡面有詳細定義詮釋資料集的資料欄位說明。

如由台北市電腦公會委託民間專家顧問團研擬34項共通資料集,如該資料集已經開放,但欄位結構不大相同,請問要如何處理?

台北市電腦公會委託民間專家顧問團研擬的共通資料集,其欄位可區分為三大部份:(Part 1)與名稱相關的欄位、(Part 2)與地址相關的欄位、(Part 3)備註與擴充欄位。其中(Part 1)與(Part 2)的欄位,是以選取最基本共同的欄位為依據。而目前計劃的推動,也是以推動各縣市滿足(Part 1)與(Part 2)欄位就好。至於各縣市可依照資源的多寡,選擇在(Part 3)的擴充欄位上釋出更多的欄位。

 

若該縣市已經開放,但欄位結構不大相同,可以先進行如下評估:依據本計劃提出的3 Parts與既有縣市釋出的資料集欄位進行三大部份的比對(如下圖所示)。此一檢查可以瞭解缺漏之欄位何在,也可供做縣市瞭解未來需蒐集資料欄位的參考。

 

以「臺中市立案產後護理之家名冊」為例,在下圖中可以觀察到Part 1部份欄位在既有的資料集是完全符合的。而Part 2部份,既有許多縣市在地址的記錄並未做縣市、區域、地址、經緯度的區分,這是一個許多縣市共同面臨的問題,故而在現有人力或技術條件不足的情況下,有地址就已滿足基本條件了哦。至於Part 3的備註與擴充欄位,則視各縣市而訂的來做擴增,例如臺中市立案產後護理之家名冊中已有蒐集負責人欄位,而其他欄位在未來是否要列入蒐集,就可做為各縣市的參考依據哦!

很多資料,尤其是衛生局、環保局的資料,就算業務單位有這筆資料,但不一定正確,要如何確保資料正確性的問題?

資料正確性(accuracy)一直是資料品質中很挑戰的議題。理想上,若能確保資料正確無誤再進行釋出動作是最好的情況,但要確認所有資料完全正確卻需要付出相當高的代價:例如人力或程式的重覆檢驗、比對等等,再加上資料量龐大,也造成資料與資料內容的比對,更需要耗費一定程度的資源。換個方式來思考,以下提供二個方法往資料正確性的方向努力:

  1. 開放資料釋出之後,可以請求民間力量的協助,集結群眾力量(crowdsourcing),讓大眾來幫忙發現問題所在,回報給政府的業務單位,如此可減輕業務單位確認資料正確性的作業。
  2. 對於例行性要蒐集的資料,例如衛生局的醫療院所資料,可以在往後的資料蒐集時以新的、正確的資料,來替代過去已知不正確的資料。透過滾動式的方式,讓資料正確性以漸進或的方式來達成。

如何保謢個人資料?如何做到真正的去識別化?做到什麼程度才夠?

依照「個人資料保護法」第2條中的規定,個人資料是指「自然人之姓名、出生年月日、國民身分證統一編號、護照號碼、特徵、指紋、婚姻、家庭、教育、職業、病歷、醫療、基因、性生活、健康檢查、犯罪前科、聯絡方式、財務情況、社會活動及其他得以直接或間接方式識別該個人之資料」。個人資料保護法將個人資料在分為兩個類型:(1)直接識別、與(2)間接識別。其中在公務機關對個人資料的保護方面,依據個人資料保護法施行細則中的第三條之規定,「間接識別」指的是保有該資料之公務或非公務機關僅以該資料不能直接識別,須與其他資料對照、組合、連結等,始能識別該特定之個人。

 

在保護個人資料時,可參考下圖流程來進行個人資料處理上的判斷:

【第一步】業務單位檢視該單位手中擁有的開放資料,其內容是否包含個人資料保護法第2條裡面所提及到的個人資料。

【第二步】若資料內有出現法令中所保護的個人資料範疇,同仁則需把資料進行去識別化的處理程序,包括(a)刪去,或(b)去識別化。而在去識別化的過程中,可以依資料的性質,進行(1)代碼、(2)匿名、(3)資料部分隱匿的方式,使他人無從辨識特定當事人之身分資料。並檢視是否能夠藉由多重資料交叉比對而產生再識別的可能性。

【第三步】開放資料釋出。

資料治理與開放資料有甚麼關聯?

資料治理(Data Governance),由國際資料治理協會(The Data Governance Institute)定義:『資料治理是實踐以資料來制定相關決策與授權的過程(Data Governance is the exercise of decision-making and authority for data-related matters)』可以了解,資料治理是一系列處理資料的政策與程序,並應用數據資料做為決策依據,對於政府機構應用,資料治理強調證據導向的決策(Evidence Based Decision-Making),將資料當作證據來輔助決策,而證據的取得需要透過完整、詳細的資料分析來佐證才能找出具有明確關聯性的因子做為決策支援。資料治理之應用目標與效益,可見國際資料治理協會之定義:

 

  1. Enable better decision-making(能夠做出更好的決策)
  2. Reduce operational friction(減少工作上的衝突)
  3. Protect the needs of data stakeholders(保護資料利害關係人的需求)
  4. Train management and staff to adopt common approaches to data issues(提供管理或業務人員採取一致方法處理資料問題)
  5. Build standard, repeatable processes(建立標準,可重複的流程)
  6. Reduce costs and increase effectiveness through coordination of efforts(降低協調過程的成本並提升效率)
  7. Ensure transparency of processes(確保過程的透明度)

 

因此,討論資料治理與開放資料之關聯,實為彼此互相連結的需求關係,當政府機構或民間團體依據數據資料進行決策制定時,開放資料提供了廣大多元的異質數據做為決策制定之使用,同樣的,許多開放資料亦同樣產生於政府對資料治理之需求而釋出之資料集。透過大量開放資料的產生與釋出,對於資料治理之發展將有顯著的幫助;反之,針對資料治理之需求,也將改善開放資料之完整性與開放資料品質。

請問甚麼是Open API?許多縣市的資訊人員並無科技技術背景,該如何能將手上的業務資料以API的形式開放?

Open API當中所指的API,意思為軟體工程領域中的應用程式介面(Application Programming Interface,API),其意義為管理一個程式與其他程式溝通互動的介面接口,當程式開發人員將一個具有商業邏輯或資料處理程序的程序包裹為可以重複呼叫執行的單元或模組,便可以透過API提供其他程式進行連結操作,對於其他應用程式開發者來說,就毋需再重新打造相同功能或撰寫重複的程式,而是直接透過連結API就能使用功能。

 

而Open API所代表的,即為公共存取的應用程式介面,允許給開發單位之外的軟體開發者,透過外部連結方式(通常為網際網路)給予程式、網頁或手機App的功能串接,讓程式能”自動”的連結使用,舉例來說,許多政府Open Data即為採用Open API的形式開放程式連接,透過機器可讀的制定格式(如JSON)與接口存取方法(如Restful)或制定嚴謹的機器可讀描述規範OAS(OpenAPI Specification),讓機器可以直接讀取資料並且瞭解資料格式與內容,無須再像過去採用手動或修改爬蟲程式的方式來取得Open Data的資料。

 

簡單來說,透過OpenAPI,可以讓程式實現自動讀取、寫入、交換資料、處理資料,無須再透過人工或者爬蟲程式進行,可以大幅提升效率與降低人力成本。關於使用Open API的好處(請參考民國106年國家發展委員會發佈的Open API應用簡介)介紹如下:

  1. 增加服務的可及性:讓其他第三方單位可以整合或簡化機關所屬的資料與內容。
  2. 節省時間:機關可以只要更新一次資料或內容,API可以自動地在網站、行動平台與社群媒體等多個位置上自動更新。
  3. 節省成本:讓第三方創新者使用資訊和服務而創造新的、有用的產品,而此產品是超出機關的範圍或預算之外。
  4. 加速產品的開發:藉由對於內容的重整和開放使用,讓內部團隊和合作單位增進打樣與使用速度,加速產品的開發。
  5. 建立市場:藉由改善政府資源的使用如健康、經濟、能源、教育、環境資源,提供企業在此基礎上建立市場。

 

然而,由於Open API為軟體間溝通的方法,因此在實現上需要具有高度的資訊開發知識,但仍可透過委託廠商提供資訊服務進行Open API之建置,並可將共通性應用程式介面納為資訊服務採購的預設履約標的之一當履約標的涉及應用程式介面開發或增修,廠商應提供符合共通性應用程式介面規範之服務,並可要求符合國家發展委員會所發布之『共通性應用程式介面規範』(發資字第1061501003號函)

詳細請參考:https://theme.ndc.gov.tw/lawout/LawContent.aspx?id=GL000270

Scroll To Top