跳到主要內容區塊

在地化Localization

地方政府開放資料常見問題-資料面

2017-02-22
滑動icon以下表格可左右滑動,瀏覽內容

問題

解答

政府資料開放和政府資訊公開有何不同?

為便利人民共享及公平利用政府資訊,政府於民國94年頒定「政府資訊公開法」,明定與人民權益攸關之施政、措施及其它有關之政府資訊,以主動公開為原則並應適時為之,期透過施政之公開與透明,保障人民知的權利,增進人民對公共事務之瞭解、信賴促進民主之參與。資訊公開的方式包含刊載於政府機關公報或其他出版品、提供線上查詢、舉行記者會或說明會、提供公開閱覽、抄錄影印等。

配合資通訊科技的發展進步,除了資訊公開外,各國逐漸推動資料開放,「政府資料開放」(Open Government Data)就是由政府機構將其所持有的大量資料進行數位化後,以資料集 (dataset) 為基本單位採開放格式存置於固定網址,讓所有民眾都可以透過網際網路搜尋並取得所需資料,讓民眾在不受到限制的情形下,進行編輯、分析、公開傳輸或為其他利用方式,開發各種產品或應用服務,滿足民眾「用」的「權益」。

舉例來說,您可以到政府開放資料平臺
(點選前往瀏覽)去尋找您所需要的資料集。

為什麼要推動政府資料開放?有什麼好處?

民眾為參與公共政策過程、監督政府施政作為或從事各項經濟活動,有賴大量且正確之資料,而政府正是各項資料的最大擁有者。將政府資料開放供民間自由取用已蔚為國際趨勢,藉由政府資料的開放,滿足民眾資料使用需求,促使跨機關資料流通,增進施政效能,提升民眾生活品質,強化民眾監督政府的力量。

 

此外政府資料開放可結合民間無限創意,活化政府資料應用,能更進一步提升政府資料品質及價值,進而創新政府服務,並透過開放授權民間應用,創造資訊服務產業發展契機,期達成增進施政透明開放、提升機關決策品質、發展多元便民服務及助益資訊產業轉型等效益,創造民眾、政府與業界三贏局面。

政府資料開放須依據甚麼原則?

政府資料開放之範圍,為各機關於職權範圍內取得或做成,且依法得公開之各類電子資料,包含文字、數據、圖片、影像、聲音、詮釋資料(metadata)等。

 

各機關以無償提供為原則。但有特殊業務需求者,得約定收費方式及金額,並定期檢討該約定;其收費,並得依資料使用目的或使用模式約定不同費率。

相關規定,詳見:行政院及所屬各級機關政府資料開放作業原則(點選前往瀏覽)

如何訂定開放資料行動計畫(action plan)?

自2012年起,行政院所屬各機關以「資料開放民眾與企業運用」、「以免費為原則、收費為例外」、「資料大量、自動化而有系統的釋放與交換」3步驟,並配合「主動開放,民生優先」、「制定開放資料規範」、「推動共用平臺(Data.gov.tw)」、「示範宣導及服務推廣」等4大焦點策略循序推動政府資料開放工作。

 

而長期以來我國地方政府與民間應用鏈結較於薄弱,為突破此問題,建議建立政府資料開放諮詢機制,加速資料開放;並推動法規鬆綁及提升資料品質,建構開放環境,其相關執行做法,可參考:

  1. 政府資料開放行動計畫:http://beta.join.gov.tw/book/zheng_fu_zi_liao_kai_fang.html
  2. 政府資料開放進階行動方案:http://www.ndc.gov.tw/Content_List.aspx?n=B2A92523DCC12607
  3. 行政院所屬各二級機關「開放具體行動計畫」

http://www.dgbas.gov.tw/public/data/open/InfoM/M/Plans-of-Action.pdf

此外,另外可以參考國外一些案例

  1. UK Open Government National Action Plan 2016 to 2018

https://www.gov.uk/government/publications/uk-open-government-national-action-plan-2016-18

    2.  US Obama gov: U.S. OPEN DATA ACTION PLAN

https://obamawhitehouse.archives.gov/sites/default/files/microsites/ostp/us_open_data_action_plan.pdf

要開放那些資料才符合民間需求?

建議可以參考政府開放資料平台瀏覽數、下載數最多的資料集(http://data.gov.tw/data_usage/dataset?order=totalcount&sort=desc),如:不動產買賣實價登錄批次資料勞工體格及健康檢查認可醫療機構CNS11643中文標準交換碼全字庫(簡稱全字庫)行政院所屬中央及地方機關代碼空氣品質即時污染指標中央氣象局雨量站觀測資料鐵路時刻表鄉鎮市區界線(TWD97經緯度)等,瀏覽數、下載數多可以發現與民生及民間需求量較為相關。

但其實政府機關平常在做業務資料,就是民間需求了,千萬不可以量為指標來看,而是要思考平常的業務資料,如何進行開放,便即可符合國民需求。

中央政府已經開放的資料,地方政府還需要開放嗎?

可以中央與地方合作、協調後,然後進行開放;也可以中央、地方均開放,由取用人自行選擇。這兩者的資料開放流程、行政作業、資源配置以及之後取得的績效都會不一樣,地方政府應多思考如何跟中央政府競合,如何讓國民多信賴自己的單位,而開放資料是一個很好的方式。

資料格式欄位與語意問題各地都不統一,請問應如何兼顧資料開放及資料格式欄位、語意之問題?

建議先求至少完成基本的開放資料,格式、語意等統一,需要的是有單位、組織或人們,出來帶頭與協調完成的。如果該單位已經做好開放資料,如果進而要優化自己的欄位、語意等,這過程會產生標準語規範,此時可以當成領先者,帶領其他單位將這件事情做好,制定統一的標準,建議可以參考以下資料:

  1. Web3.0 語意網新趨勢 ─ 與TELDAP之實作應用http://ebook.teldap.tw/ebook_detail.jsp?id=176
  2. US data.gov 的 SEMANTIC WEB https://www.data.gov/semantic.
  3. W3C semantic web https://www.w3.org/standards/semanticweb/data

各資料集是否有建議詮釋資料參考,否則各地皆不統一,民眾也難以尋找

針對建議詮釋資料格式,政府開放資料平台(http://data.gov.tw)提供『資料集詮釋資料標準規範』供資料提供單位有足夠的詮釋資料描述資料集特性。詳細內容請參考資料集詮釋資料標準規範網頁文件( http://data.gov.tw/node/18252 )

 

此外,在增進民眾查找開放資料便利度上,可以參考政府開放資料平台(http://data.gov.tw)的『政府資料開放跨平臺介接規範』,該介接規範允許資料串連發布至「政府資料開放平臺」,以利資料集之散佈與傳遞。該規範提供發布應用方式如下:

  1. 不同資料開放平臺的詮釋資料可更新至「政府資料開放平臺」。提供「政府資料開放平臺」擷取「詮釋資料提供平臺」所發布之詮釋資料、或由「詮釋資料提供平臺」主動發布詮釋資料至「政府資料開放平臺」。
  2. 「詮釋資料需求平臺」取得其他機關資料集詮釋資料。「詮釋資料需求平臺」可透過「政府資料開放平臺」擷取「詮釋資料提供平臺」所發布之詮釋資料,並同步更新之前所取得的其他機關資料集詮釋資料,達到任一機關單一資料集詮釋資料可更新至多個資料開放平臺。

詳細資料請參考『政府資料開放跨平臺介接規範』網站資訊:http://data.gov.tw/node/18254

甚麼是詮釋資料?如何制定?有相關參考的做法嗎?

詮釋資料(Metadata)是描述資料的資料,幫助使用者辨識、描述,及定位資訊(包括電子資訊及非電子資訊),又稱描述性資料、元資料、中介資料等。例如,圖書館的「圖書資料庫系統」便是一種詮釋資料(庫),它紀錄了圖書館內所有圖書的書名、作者、出版者等相關資料。每一本書的目錄也是一種詮釋資料,它描述各章節(資料)的標題。詮釋資料庫通常搭配「檢索系統」,供人很容易找到所需的資料。

詮釋資料庫涉及許多專業領域知識,行政院104年7月公布「資料集詮釋資料標準規範」,希望(1)各政府單位以該規範之通用性資料集標準框架為基礎,發展符合部門業務之詮釋資料標準內容,讓各資料提供者有足夠的詮釋資料描述資料集特性;(2)方便資料使用者便利、有效、快速地找到所需的政府開放資料,以達成跨機關各類資訊資源交換作業及資料加值應用。

 

該規範中詳述:資料集詮釋資料之類別、通用性資料集標準框架及綱要、欄位詳細說明(包括詮釋資料欄位基本規定、資料型態、欄位定義等),以及標準規範範例。可以參考該規範中的制定方法及範例,製作屬於自己單位的詮釋資料及標準。

政府資料分成甲類、乙類、丙類清單,是以甚麼作為區分?該開放哪類的資料?

政府開放資料政策實施以來,各機關資料可不可以開放?需不需要收費?等議題眾說紛紜;且於大數據分析時代,政府也需整合跨部門、跨部會等資料,來作大數據分析,以為政策決策之依據;但部門、部會間的資料應不應相互開放?如何開放?要不要收費?涉及機密資料時資料擺放位置如何?也是眾說紛紜。然而,大時代的巨輪持續滾動著,今日不做,明日將遠遠被人民拋棄。

 

因此,行政院104年11月公布「行政院及所屬各機關政府資料分類及授權利用收費原則」,希望作為政府資料之分類,及以民事契約約定其授權利用之收費項目之依據,以擴大推廣政府資料活化應用。

該規範第三條,政府資料之類型可區分為甲類、乙類、丙類資料。

甲類資料就是一般所謂的開放資料,是可以開放給大眾無償、可再轉授權的使用。政府所有的資料基本以開放為原則,但若建置成本達一定金額者,得提報行政院資料開放諮詢小組審核後,始得列為甲類資料。

乙類資料為有限度利用資料,指以開放格式提供,且符合下列條件之一者:有償提供、保留撤回權、其他限制條件授權利用。

丙類資料為不開放資料,指依法律規定不得開放、因資料敏感或有其他特殊情形,經各機關首長核可不予開放者。

有許多資料集使用度低,如此該資料集還有必要開放嗎?

依行政院104年11月公布「行政院及所屬各機關政府資料分類及授權利用收費原則」的甲類資料定義:即開放資料,指以開放格式提供,且以無償方式、不可撤回,並得再轉授權方式授權利用為原則者。

 

已開放的資料是不可撤回的,即使用度低,既然已經開放,就不得撤回了。

 

基本上,政府將既存的資料開放,讓民眾或產業能結合其創意,發揮最大應用效益。若釋出的資料集使用度低,則可思考,是否資料集本身的品質無法被民眾方便使用?是否民眾尚未想到好的應用?或者民眾不知道怎麼應用?或者還需其他部會的資料釋出?等。修改資料品質或提示民眾可能的應用都是可行的作法。

對於地方政府而言,開放資料的誘因是甚麼?

根據國發會的開放資料平台文章(https://data.gov.tw/node/1463)提到,推廣開放資料的原因,是基於民眾為參與公共政策過程、監督政府施政作為或從事各項經濟活動,有賴大量且正確之資料,而政府正是各項資料的最大擁有者。而且,將政府資料開放供民間自由取用,已蔚為國際趨勢,期藉由政府資料的開放,可帶來的益處,可廣義的包括對政府端的好處以及對人民與企業的好處:

  • 對資料提供端(政府)的好處:
  1. 促使跨機關資料流通,
  2. 增進施政效能,
  3. 提升政府資料品質及價值,
  4. 創新政府服務,
  5. 活化政府資料應用。
  • 對資料使用端(人民與企業)的好處:
  1. 滿足資料使用者對資料使用需求,
  2. 強化民眾監督政府的力量。
  3. 提升民眾生活品質,
  4. 結合資料使用者無限創意,
  5. 創造資訊服務產業發展契機

綜合上述益處,開放資料可預期的能帶來增進施政透明開放、提升機關決策品質、發展多元便民服務及助益資訊產業轉型等效益,創造民眾、政府、業界三贏局面。

 

引用高雄市政府資訊中心的劉俊傑主任曾提到:為什麼要把資料開放出來?因為民眾會用這些資料,有時候反而是減少政府同仁的負擔。有的時候民眾、社群幫我們做了一些應用服務,我們就不用重複人力或資源在上面。政府只要把那些資料丟出去,就會有很多人幫我們把這些對外服務的事情做好。

若自己本身沒有開放資料平台,可以開放到國發會平台(https://data.gov.tw/),那請問要如何開放?是否有簡單的SOP流程可以提供參考?

國發會平台的【上傳流程】

  1. 註冊成為會員→要上傳的資料集送審至資料審查方(系統會發送「資料集新增送審通知信」給審查者)→審查方會檢視資料集內容並填寫審查意見→通過→寄回「資料審查通過」通知信→依照上架日期於前台露出
  2. 註冊成為會員→要上傳的資料集送審至資料審查方(系統會發送「資料集新增送審通知信」給審查者)→審查方會檢視資料集內容並填寫審查意見→不通過→寄回資料集審查退回通知信→修改資料集→重複上傳的動作

 

國發會平台的【後臺系統管理說明】

  1. 在瀏覽器輸入後臺網址 http://cms.data.gov.tw,點選「確定」按鈕,進入我的 e 政府會員登入網頁。
  2. 請輸入您在我的 e 政府會員的公務帳號,登入成功即可進行後臺進相關 功能的使用,若尚未申請我的 e 政府會員,請連結至 https://www.cp.gov.tw/portal/person/initial/Registry.aspx 進 行申請,並須申請轉為公務帳號。
  3. 登入成功後,即進入後臺管理介面。

 

【備註】詳細上傳流程可參考國發會提供的「政府資料開放平臺_後臺管理系統操作手冊」(http://file.data.gov.tw/event/Manual_v2.pdf)。上傳時若遇上資料集詮釋問題,也可參考國發會提供的「資料集詮釋資料標準規範」(https://data.gov.tw/node/18252),裡面有詳細定義詮釋資料集的資料欄位說明。

如由台北市電腦公會委託民間專家顧問團研擬34項共通資料集,如該資料集已經開放,但欄位結構不大相同,請問要如何處理?

台北市電腦公會委託民間專家顧問團研擬的共通資料集,其欄位可區分為三大部份:(Part 1)與名稱相關的欄位、(Part 2)與地址相關的欄位、(Part 3)備註與擴充欄位。其中(Part 1)與(Part 2)的欄位,是以選取最基本共同的欄位為依據。而目前計劃的推動,也是以推動各縣市滿足(Part 1)與(Part 2)欄位就好。至於各縣市可依照資源的多寡,選擇在(Part 3)的擴充欄位上釋出更多的欄位。

 

若該縣市已經開放,但欄位結構不大相同,可以先進行如下評估:依據本計劃提出的3 Parts與既有縣市釋出的資料集欄位進行三大部份的比對(如下圖所示)。此一檢查可以瞭解缺漏之欄位何在,也可供做縣市瞭解未來需蒐集資料欄位的參考。

 

以「臺中市立案產後護理之家名冊」為例,在下圖中可以觀察到Part 1部份欄位在既有的資料集是完全符合的。而Part 2部份,既有許多縣市在地址的記錄並未做縣市、區域、地址、經緯度的區分,這是一個許多縣市共同面臨的問題,故而在現有人力或技術條件不足的情況下,有地址就已滿足基本條件了哦。至於Part 3的備註與擴充欄位,則視各縣市而訂的來做擴增,例如臺中市立案產後護理之家名冊中已有蒐集負責人欄位,而其他欄位在未來是否要列入蒐集,就可做為各縣市的參考依據哦!

很多資料,尤其是衛生局、環保局的資料,就算業務單位有這筆資料,但不一定正確,要如何確保資料正確性的問題?

資料正確性(accuracy)一直是資料品質中很挑戰的議題。理想上,若能確保資料正確無誤再進行釋出動作是最好的情況,但要確認所有資料完全正確卻需要付出相當高的代價:例如人力或程式的重覆檢驗、比對等等,再加上資料量龐大,也造成資料與資料內容的比對,更需要耗費一定程度的資源。換個方式來思考,以下提供二個方法往資料正確性的方向努力:

  1. 開放資料釋出之後,可以請求民間力量的協助,集結群眾力量(crowdsourcing),讓大眾來幫忙發現問題所在,回報給政府的業務單位,如此可減輕業務單位確認資料正確性的作業。
  2. 對於例行性要蒐集的資料,例如衛生局的醫療院所資料,可以在往後的資料蒐集時以新的、正確的資料,來替代過去已知不正確的資料。透過滾動式的方式,讓資料正確性以漸進或的方式來達成。

如何保謢個人資料?如何做到真正的去識別化?做到什麼程度才夠?

依照「個人資料保護法」第2條中的規定,個人資料是指「自然人之姓名、出生年月日、國民身分證統一編號、護照號碼、特徵、指紋、婚姻、家庭、教育、職業、病歷、醫療、基因、性生活、健康檢查、犯罪前科、聯絡方式、財務情況、社會活動及其他得以直接或間接方式識別該個人之資料」。個人資料保護法將個人資料在分為兩個類型:(1)直接識別、與(2)間接識別。其中在公務機關對個人資料的保護方面,依據個人資料保護法施行細則中的第三條之規定,「間接識別」指的是保有該資料之公務或非公務機關僅以該資料不能直接識別,須與其他資料對照、組合、連結等,始能識別該特定之個人。

 

在保護個人資料時,可參考下圖流程來進行個人資料處理上的判斷:

【第一步】業務單位檢視該單位手中擁有的開放資料,其內容是否包含個人資料保護法第2條裡面所提及到的個人資料。

【第二步】若資料內有出現法令中所保護的個人資料範疇,同仁則需把資料進行去識別化的處理程序,包括(a)刪去,或(b)去識別化。而在去識別化的過程中,可以依資料的性質,進行(1)代碼、(2)匿名、(3)資料部分隱匿的方式,使他人無從辨識特定當事人之身分資料。並檢視是否能夠藉由多重資料交叉比對而產生再識別的可能性。

【第三步】開放資料釋出。

資料治理與開放資料有甚麼關聯?

資料治理(Data Governance),由國際資料治理協會(The Data Governance Institute)定義:『資料治理是實踐以資料來制定相關決策與授權的過程(Data Governance is the exercise of decision-making and authority for data-related matters)』可以了解,資料治理是一系列處理資料的政策與程序,並應用數據資料做為決策依據,對於政府機構應用,資料治理強調證據導向的決策(Evidence Based Decision-Making),將資料當作證據來輔助決策,而證據的取得需要透過完整、詳細的資料分析來佐證才能找出具有明確關聯性的因子做為決策支援。資料治理之應用目標與效益,可見國際資料治理協會之定義:

 

  1. Enable better decision-making(能夠做出更好的決策)
  2. Reduce operational friction(減少工作上的衝突)
  3. Protect the needs of data stakeholders(保護資料利害關係人的需求)
  4. Train management and staff to adopt common approaches to data issues(提供管理或業務人員採取一致方法處理資料問題)
  5. Build standard, repeatable processes(建立標準,可重複的流程)
  6. Reduce costs and increase effectiveness through coordination of efforts(降低協調過程的成本並提升效率)
  7. Ensure transparency of processes(確保過程的透明度)

 

因此,討論資料治理與開放資料之關聯,實為彼此互相連結的需求關係,當政府機構或民間團體依據數據資料進行決策制定時,開放資料提供了廣大多元的異質數據做為決策制定之使用,同樣的,許多開放資料亦同樣產生於政府對資料治理之需求而釋出之資料集。透過大量開放資料的產生與釋出,對於資料治理之發展將有顯著的幫助;反之,針對資料治理之需求,也將改善開放資料之完整性與開放資料品質。

請問甚麼是Open API?許多縣市的資訊人員並無科技技術背景,該如何能將手上的業務資料以API的形式開放?

Open API當中所指的API,意思為軟體工程領域中的應用程式介面(Application Programming Interface,API),其意義為管理一個程式與其他程式溝通互動的介面接口,當程式開發人員將一個具有商業邏輯或資料處理程序的程序包裹為可以重複呼叫執行的單元或模組,便可以透過API提供其他程式進行連結操作,對於其他應用程式開發者來說,就毋需再重新打造相同功能或撰寫重複的程式,而是直接透過連結API就能使用功能。

 

而Open API所代表的,即為公共存取的應用程式介面,允許給開發單位之外的軟體開發者,透過外部連結方式(通常為網際網路)給予程式、網頁或手機App的功能串接,讓程式能”自動”的連結使用,舉例來說,許多政府Open Data即為採用Open API的形式開放程式連接,透過機器可讀的制定格式(如JSON)與接口存取方法(如Restful)或制定嚴謹的機器可讀描述規範OAS(OpenAPI Specification),讓機器可以直接讀取資料並且瞭解資料格式與內容,無須再像過去採用手動或修改爬蟲程式的方式來取得Open Data的資料。

 

簡單來說,透過OpenAPI,可以讓程式實現自動讀取、寫入、交換資料、處理資料,無須再透過人工或者爬蟲程式進行,可以大幅提升效率與降低人力成本。關於使用Open API的好處(請參考民國106年國家發展委員會發佈的Open API應用簡介)介紹如下:

  1. 增加服務的可及性:讓其他第三方單位可以整合或簡化機關所屬的資料與內容。
  2. 節省時間:機關可以只要更新一次資料或內容,API可以自動地在網站、行動平台與社群媒體等多個位置上自動更新。
  3. 節省成本:讓第三方創新者使用資訊和服務而創造新的、有用的產品,而此產品是超出機關的範圍或預算之外。
  4. 加速產品的開發:藉由對於內容的重整和開放使用,讓內部團隊和合作單位增進打樣與使用速度,加速產品的開發。
  5. 建立市場:藉由改善政府資源的使用如健康、經濟、能源、教育、環境資源,提供企業在此基礎上建立市場。

 

然而,由於Open API為軟體間溝通的方法,因此在實現上需要具有高度的資訊開發知識,但仍可透過委託廠商提供資訊服務進行Open API之建置,並可將共通性應用程式介面納為資訊服務採購的預設履約標的之一當履約標的涉及應用程式介面開發或增修,廠商應提供符合共通性應用程式介面規範之服務,並可要求符合國家發展委員會所發布之『共通性應用程式介面規範』(發資字第1061501003號函)

詳細請參考:https://theme.ndc.gov.tw/lawout/LawContent.aspx?id=GL000270

滑動icon以下表格可左右滑動,瀏覽內容

想了解其他縣市的研考處,是怎麼處理民眾陳情的資料,要如何面對個資問題,可否舉例有哪些的應用與效益?

台灣各縣市多設有1999服務或市政信箱,以接受民眾陳情與通報。現階段運作較佳的縣市有:高雄市、桃園市、台南市,此三縣市可做為其他縣市在推動民眾陳情服務的示範,服務網站如下:

  1. 高雄市1999服務應用成果:https://1999.noob.tw/
    開放資料集1(即時600) https://data.kcg.gov.tw/dataset/open1999
    開放資料集2(一年內歷史資料) https://data.kcg.gov.tw/dataset/open1999-history
    開放資料集3(100~106年歷史資料) https://data.kcg.gov.tw/dataset/100-open1999
  2. 桃園市1999服務應用成果:https://tycg1999.noob.tw/
    開放資料集來源:https://data.tycg.gov.tw/opendata/datalist/datasetMeta?oid=35e16932-4427-46ce-b67f-811e5d569e00
  3. 台南市1999服務應用成果:http://1999.tainan.gov.tw/1999_main_visualization/index.html
    開放資料集:http://data.tainan.gov.tw/dataset/1999

 

開放資料本基於去辨別化、去除個資的情況下所開放的公共資料。如上三縣市所產生的服務系統,可包括二個層面:() 1999通報資料,此部份資料較少個資疑慮,如上三縣市1999服務應用成果,足以做為其他縣市之參考示範。() 陳情資料,雖可能存在個資,但亦能夠透過去識別化的方式,將陳情資料透過數據的分析,洞察市民陳情反應在時間、空間、地區別等的訊號,以供市府相關局處掌握民眾聲音、解決民眾的困擾,進而提升市民滿意度。

因為目前地方政府已經習慣用現有的方法來做事,不知道開放資料應用的效益在哪?

開放資料已是全球趨勢,透過開放資料為基礎,以期開放政府此一目標。對於任何新的改變,意謂著必須在現有的作業與思考模式上的反思與調整,此一改變亦是促進政府往前進重要的步伐。建議局處同仁可以從開放資料下手瞭解,相關開放資料的問題,可參見「地方政府開放資料常見問題-資料面」(https://opendata.tca.org.tw/index.php/article/readfull/4/3)

觀察台灣22縣市,諸多縣市已透過開放資料帶來許多的成果與服務應用,相關成果可從政府資料開放平臺 (https://data.gov.tw/) 中的資料故事館,項目下有四種資料成果的展現;以及各縣市政府的開放資料平台,也有「開放資料活化應用成果」的相關專區。

這些以開放資料為基礎的應用服務成果,非常值得各縣市、局處同仁多加參考,也在觀摩各縣市的作法與成果中,體會到開放資料應用的效益,而此一效益所代表的必然是多元的:對市府、對市民等等,而這些效益,必須建立在縣市局處願意將資料開放出來,資料才能透過被運用,活化並產生出其效益和價值。

目前想了解醫療資源的分布,但不知道應該收集哪些資料來完成這件事

新竹市本身設有開放資料平台,透過適當的關鍵字 (例如:醫療、照護、產後、流感、托育),可以搜尋到許多關於醫療資料的相關資料集。部份示例畫面如下截圖所示:

 醫療資源是一個縣市與民眾息息相關的資訊,建議新竹市可著手羅列相關的醫療資源,並嘗試以使用族群為核心,例如老人相關的有長照等、婦女相關的有產後護理之家、哺集乳室等、嬰幼兒相關的有托育、疫苗等等,透過如上方式思考各族群可能會運用到的資源,才有辦法進一步的將這些資料做適應的應用服務呈現,讓市民對本市的醫療資源更有感、利益到民眾切身的需要。

敏感性資訊該怎麼進行資料處理?以及會有外洩之可能性嗎?

敏感性資料常見於政府資料中,為降低敏感資料外洩之疑慮,通常會使用去識別化程序移除或模糊個人資料中任何可識別資訊,降低個人非意欲揭露其相關資訊的風險。其產生的資料使不可逆推原始資料,但適當保留了原有的格式與類型。目前在國際上對於去識別化有較完整規範的包括了英國的資訊專員公署(Information Commissioner's Office)與民間籌組UK Anonymisation (UKAN)來建立適當標準,美國的健康保險可攜與責任法Health Insurance Portability and Accountability Act (HIPAA)與衛生及公共服務部Department of Health and Human Services (DHHS)等機構組織,還有2017ISOI公布的ISO25237,也對去識別化(虛名化)提供了適當的標準與規範。我國分別於1036月以及1046月公佈國家標準CNS29100「資訊技術-安全技術-隱私權框架」、以及CNS29191「資訊技術-安全技術-部分匿名及部份去連結鑒別之要求事項」,作為現階段個人資料去識別化之驗證標準。

 

實務上,敏感性資訊之處理一般可分成兩個層面:其一為去除敏感性資料欄位;其二為避免敏感資料逆推。去除敏感性資料又可分為直接去除或資料轉換。直接去除即將該敏感欄位直接刪除,例如刪除姓名欄,然而可能會造成資料識別性不足的問題,不利後續應用。資料轉換即去識別化(de-identification),使無法直接或輕易的判讀原始資料之可識別資訊,如姓名或身份證字號等。常用之資料轉換技巧包括匿名(例如用代號取代姓名)、資料加密、資料模糊化(加入雜訊,如將年齡加上一隨機值)、資料概化(降低資料精準度,如年齡欄位由歲數變成年齡層)、資料合併(13月資料合併為第1季資料)等。然而部份轉換過程將喪失原始資料之精準度或特性,須評估後使用。

 

另外亦須注意間接識別資料的問題,即雖然採取了上述措施去除敏感性資料後,尚可利用資料比對、組合、連結等方法還原特定識別資料。例如即使已進行匿名處理,仍可依其生日、住址等資料回推其個人身份。間接識別資料的處理方式可以檢視資料欄位之相關性後,對特定或所有相關欄位進行去識別化處理,降低被重新識別之可能性。

 

進行適當去識別化程序後之資料,一般無法輕易被還原,故應無資料外洩之慮。常見之資料外洩發生在資訊安全措施不足之情況下,例如密碼洩露、病毒感染、網頁架構不良等。故做好資訊安全措施更能防範資料外洩事況。

因為不知道民眾需要什麼樣的政府資料,因此不知道該開放什麼樣的資料

經濟部工業局委託台北市電腦公會在2017年為協助地方政府開放資料與強化資料品質,委請民間專家顧問團研擬34項「共通資料集清單」,含34項各縣市最常為民眾需要的資料集名稱、欄位名稱及資料集Schema,各地方政府相關局處可參考以這些資料集為基礎,優先進行開放,詳細資料集資訊請見:https://opendata.tca.org.tw/index.php/article/readfull/4/11

目前還在資料收集的階段,若要符合開放資料的需求,該怎麼做?

對於開放資料正在起步階段的縣市,可以直接以各縣市都有相同需求的資料集為入手處。經濟部工業局委託台北市電腦公會在2017年為協助地方政府開放資料與強化資料品質,委請民間專家顧問團研擬34項「共通資料集清單」,含34項各縣市最常為民眾需要的資料集名稱、欄位名稱及資料集Schema,各地方政府相關局處可參考以這些資料集為基礎,優先進行開放,詳細資料集資訊請見:https://opendata.tca.org.tw/index.php/article/readfull/4/11

 

開放資料要從哪裡下載?相關資料集又要如何下載?是否能提供相關步驟或SOP給予參考

國家發展委員會所建置之政府資料開放平台(http://data.gov.tw/),設置彙整中央機關不同部會與地方政府開放資料集。在「全部資料集」專區當中,可以依照:主題分類、提供機關、服務分類、檔案格式等等不同類別進行檢索。

一般來說政府資料開放平臺提供的各政府機關開放資料,依據資料性質的不同,而有不同格式,初期提供以開放檔案格式如CSV、XML及 JSON等格式為主,提供使用者下載應用,民眾可針對熟悉的工具如: OpenOffice、Microsoft Excel或是透過程式語言自行撰寫分析與資料整合方法,建議可依資料集「資料集類型」欄位,判斷資料集提供類型,目前平臺分為兩項類型「系統介接程式」、「原始資料」等,部分資料集直接透過「系統介接程式」(API)提供使用,則需透過軟體或自行開發程式進行資料界接

下載SOP如下所示:

  1. 在首頁搜尋列輸入資料集關鍵字,輸入「政府資料開放平臺資料集清單」,並點選查詢。

  1. 接著從查詢結果中,點選「政府資料開放平臺資料集清單」資料集。

  1. 「政府資料開放平臺資料集清單」資料集,提供兩種格式(CSV、XML)供民眾下載。
  1. 點選全部資料集頁面,最下方匯出資料集清單。

  1. 可透過左側搜尋篩選功能,匯出符合需求之資料集清單,政府資料開放平臺資料集清單資料集,提供三種格式(CSV、XML、JSON)供民眾下載。

詳細程序煩請參考平台「如何獲得政府資料開放平臺的資料集清單」(https://data.gov.tw/node/15488),以瞭解資料檢索與下載流程。

國發會的政府資料開放平台存有太多資料集,除了有分相關單位提供可以進階搜尋外,是否還有其他功能,更快協助找尋所需資料集?

針對資料的尋找可以採用以下方式

  1. 分類查詢

在「全部資料集」專區當中,可以依照:主題分類、提供機關、服務分類、檔案格式等等不同類別進行檢索。同時,亦可以採用進階查詢模式,針對搜尋範圍為資料集內的「資料集名稱、資料集描述、提供機關以及關鍵字」內容進行精確比對。相關操作方式請參考「進階查詢使用說明」(https://data.gov.tw/faq/90423)一文。

  1. 依照應用查詢相關資料集

針對相關資料應用範例,開放平台上展示各式民間團體透過資料整合所展現的數據應用實例(https://data.gov.tw/applications/search?type=application),在這些相關數據應用實例中,皆有列舉說明使用哪些資料集製作並且透過何種方式進行跨資料間的串接,可以提供民眾的個人應用參考。

  1. 提出資料索取要求

若所需要的資料沒有在政府資料開放平台中,可以透過建議功能提出資料索取要求,該平台提供二個方式:

  1. 將任何創新的想法或建議開放的資料集項目利用「我想要更多」點選「新增」提出想要政府開放資料集建議,也可以瀏覽其他民眾提出的資料集需求作為參考。
  2. 資料集內容之修正建議或使用疑義,可利用各資料集頁面上「發表新回應」功能,提供聯絡方式及建議內容,各機關將會儘速研議回覆。

 

Scroll To Top