大數據的資訊分析與隱私保護


網路上各種看似無關連的數據資訊,透過系統化與關連性的統計運算與歸納,逐漸彙整出具有高度商業價值的內容,可增進公私部門的組織效率,這種充分運用客戶所留存或創造的各種資料的趨勢,將使傳統「資通科技業」逐漸轉型為「大數據科技業」。但這種資訊探勘或分析的過程中經常忽略個人隱私的保護,因此如何敦促企業於資訊分析過程中對於個人隱私權利加以保護,誠為大數據時代極為重要的課題。本期電子報主題「大數據的資訊分析與隱私保護」,由本中心數位匯流政策法規小組葉志良助理教授從權利保護的觀點撰寫〈大數據時代下的個人隱私保護〉一文,說明法律如何對個人隱私進行保護,以及近來歐盟提倡「被遺忘權」所引發的各種爭議,並檢討大數據興起後現行隱私保護法律該如何因應;而另一篇文章〈你的數據足跡 他的網路商機?〉,是由本中心數位匯流政策法規小組召集人丘昌泰教授從網際網路的「凡走過必留下腳印」特性,說明大數據業者若要蒐集、處理與利用這些「數據足跡」,必須深思網民的隱私權、個資保護與被遺忘權,現今個資法似不足有效規範大數據的隱私與安全問題,呼籲政府應積極研修相關法律。

 資訊法律觀點  

大數據時代下的個人隱私保護
/葉志良助理教授(大數據與數位匯流創新中心-數位匯流政策法規小組)

在大數據資料分析的發展下,透過去識別可以讓許多企業發展各自不同的商業模式,但再識別科技也同時發展中,它卻可能會摧毀我們對於匿名所欲達到隱私權保護的信心。

圖片作者:opensource.com。圖片來源:Flickr
我們正生活在大數據的時代下,數據資訊已成為許多產品的原始素材,也是知識經濟與社會價值的來源。目前數據探勘與分析技術相當進步,特別在電腦運算能力與儲存空間不斷的增強與擴張的情況下,大數據的發展不僅影響著企業與政府,也影響著我們每個人的生活。此外,不斷增長的人類、各種終端設備與監
控機具,全都連接在數位網路上,隨時隨地可以生產、傳遞、分享並處理各式各樣的大量資料。不過,這種資訊洪流也隱含著個人隱私上的顧慮,倘若處理不善,可能造成規範上的衝擊、嚴重損害資訊經濟,並阻礙創新。傳統對於資訊遠距傳送的保護,主要採取去識別性(de-identification)的做法,例如:匿名化、加解密、資料重組等,但Paul Ohm 教授在其Broken Promises of Privacy 一文指出,由於技術的進步,這些匿名資料也可能再被識別(re-identification),甚至可以辨識出特定個人。在大數據資料分析的發展下,透過去識別可以讓許多企業發展各自不同的商業模式,例如醫療資訊、線上行為廣告,以及雲端運算等;然而,再識別科技也同時發展中,它卻可能會摧毀我們對於匿名所欲達到隱私權保護的信心。
隱私保護法律是建立在個人對於其資料的管控,例如最小蒐集原則與目的限制原則等,但在大數據時代,資料蒐集最小化不知能否維持作為保護隱私的方式。由於隱私權必須與其他社會價值(包括公共衛生、國家安全、法律執行、環境保護以及經濟效率等)相互權衡,因此當使用資料的利益遠大於隱私風險時,就必須確保資料處理的合法性,例如採取去識別的做法。
Google是現今蒐集資料的重要工具,讓使用者即使輸入「接近」的關鍵字,曾經上網公開的資料也可能被找到,即使資料遭原始網頁刪除或連結失效,仍可利用「頁庫存檔」來加以瀏覽。歐盟正將「被遺忘權」(the right to be forgotten)納入其新修正的資料保護指令(Data Protection Directive)中,今年五月歐盟法院對於「被遺忘權」作出裁決,判決Google必須按用戶請求刪除「不充分、不相關或已過時」的資料,保證該資料不會出現在搜索結果中。但被遺忘權引發許多爭論,最主要莫過於是否會造成「竄改歷
圖片作者:Javier Domínguez Ferreiro。圖片來源:Flickr


史」的謬誤,以及是否對言論自由(特別是新聞媒體)造成侵害。此外,要真正貫徹被遺忘並不容易,要Google刪除一份網路上資料,但該資料卻可能早已轉載於其他部落格、社群網站、討論區或存在於Google以外的搜尋引擎。
隱私是讓一般人能決定何時、如何及將多少個資向他人傳達的權利,但經常與之衝突的是「知情權」(the right to know),特別是涉及公共利益或與政府運作有關事項,公眾應可自由索取與檢視。但若被遺忘權正式入法後,被有心人操作或遭假借隱私之名而行內容審查之實,將對特定人不利的網路跡證加以刪除,不免讓人懷疑這種全面性權利的正當性。例如Google分析其收到最先41千筆請求刪除資料的原因,發現有超過六成的刪除請求是涉及刑事犯罪的內容。另外在網路環境下,上網行為都會透過Cookie技術,在使用者事先授權或知道但卻不異議,甚或知曉但不瞭解的情況下,被一一記錄下來,例如瀏覽記錄、線上刷卡記錄、即時聊天內容,甚至掛號就診記錄等,這些資訊透過分析後,本身具有極大商業價值;但若有人主張被遺忘權,這些資訊由於並非完全被揭露或知悉,難以確認是否會被完全清除。
面臨大數據的興起,我們雖然擁抱它可能帶來的龐大經濟利益,但伴隨的風險卻是產生這些數據的人們根本不知道該如何處理這些「資訊流」所引發的個資濫用危機,建構在「以當事人同意」、「隱私權政策」的隱私保護假象下,當前個人隱私保護法律應該要作一番徹頭徹尾的檢視,以符合大數據時代的發展。

(作者:元智大學資訊傳播學系葉志良助理教授, Emailchyeh@saturn.yzu.edu.tw )

資訊政策觀點

你的數據足跡 他的網路商機?
/丘昌泰教授(大數據與數位匯流創新中心-數位匯流政策法規小組召集人)
未來阿里巴巴集團要充分運用客戶採購資料,將集團從資通科技業,轉型為大數據科技公司,這個大數據革命若以正面態度加值運用,確實能造福人類;但我們上網時無形中留下的數據足跡是無法消滅的,這些資料若被不肖的政府與企業所利用,形成數據監控,就容易出現更多的「史諾登事件」。
大數據浪潮正襲捲兩岸三地,被產業界視為第五波科技革命後的明星產業。
據國際數據中心估測,全世界資料量以每年五十%的速度增長。IBM則預測大數據商機至二一五年約為一八億美元。中華電信研究院研發雲龍系統利用大數據 分析技術,能在十秒內畫出歹徒的行徑軌跡;馬雲的阿里巴巴集團曾誇口說,未來他要充分運用客戶採購資料,將集團從資通科技業,轉型為大數據科技公司。由此 可見,雲端科技帶來的大數據革命,若以正面態度加值運用,確實能造福人類。
網際網路的特性之一是「凡走過,必留下腳印」,大數據業者蒐集這些「數據足跡」加以整體性的分析、加值與利用,從而產生巨大商機,不必顧及留下數據足跡的 網民之意願與數據真實性,是否侵犯了個人隱私與個資保護法?若留下的數據足跡是錯誤歪曲資訊,可以要求業者撤除這些妨礙個人名譽的網路資訊嗎?在網路世界裡,我擁有「被遺忘的權利」嗎?很顯然地,大數據背後值得深思的課題,是網民的隱私
圖片作者:Ian Fogg。圖片來源:Flickr
權、個資保護權與被遺忘權。

近日,美國媒體強烈批評,全球最大社群網站臉書與多所大學利用會員上網流量進行的情緒實驗,他們秘密操控近七十萬名用戶的訊息流,發現網民情緒好像傳染病一樣,可透過社交網絡傳達出去,而每個人的心情是會受到社交網絡內容影響的。臉書未事先徵得用戶同意,在他們不知情下進行這項實驗,令許多網民大感憤怒。然而,臉書卻振振有詞說:在加入會員前,已簽署同意運用上網資料的聲明,並無不法,更何況這樣的實驗是為了提升客戶的服務品質。
當我們看好第五波大數據浪潮的來臨,宜注意個資隱私權與被遺忘權問題;當我們上網時,無形中留下的數據足跡,是無法消滅的,個人隱私乃無所遁形,若被不肖的政府與企業所利用,形成數據監控,就容易出現更多的「史諾登事件」。
現行我國的《個人資料保護法》是大數據潮發生前的傳統法律,不足以有效規範大量化、多樣化與高速化的大數據造成的上網隱私與安全問題,建議政府應積極研修相關法律,兼顧大數據發展帶來的大商機與大安全。 (本文曾發表於聯合報201472日意見評論)。
(作者:元智大學社會暨政策科學系丘昌泰教授,EmailTedchiou@saturn.yzu.edu.tw )


大數據小園丁

數位匯流政策法規小組
自本期起,每期主題將由中心各小組的小園丁負責,分享現階段的研究成果。本期主題由本中心「數位匯流政策法規小組」葉教授與丘教授發表以上兩篇短文,是數位匯流政策法規小組的研究心得。
政策法規小組目前成員有12位,研究方向除大數據個資隱私議題外,主要集中在數位匯流政策法規研究、社會衝擊與產業研究。小組成員個別研究包括:數位匯流與城鄉數位落差、大數據時代中海峽兩岸的個資與隱私權法制比較研究、資訊災救政策研究、影音平台產業與可行性分析、新傳播媒體研究、數位匯流產業匯流進程之研究,以及網路中立性法制發展研究等。本小組目前已完成一項產學委託研究案、獲得2015 CPR South國際學術研討會主辦權,並預定10月底舉辦產官學界溝通平台的電信論壇。
數位匯流新創服務小組
創新服務小組之研究方向係聚焦於互動多媒體相關技術發展與應用;主題涵概互動多媒體產品規劃與設計、核心技術發展,系統設計與行銷評估等層面,並擔任國內相關產品開發的輔助與顧問團隊。

創新服務小組擬以後端平台之媒體安全為主軸,結合影像處理、內容典藏、圖形識別、資料保護、電腦圖學技術。本小組之研究進而運用高階繪圖處理、快速有效的三維物件處理演算法與應用程式,輔以媒體介面設計、視覺藝術呈現、數位學習應用、遊戲規劃、以及互動影音應用整合系統。下一篇〈從社群資料匯集與分析,走入客制化專門服務〉則是由「數位匯流新創服務小組」江振維教授所撰,介紹該組TOMO行動appTourTube以及PreViz 3D視覺化效果。



從社群資料匯集與分析,走入客制化專門服務
/江振維助理教授(大數據與數位匯流創新中心-數位匯流新創服務小組)

結合社群力量並進行創意再生已是近年來網路生態發展主軸,各式虛擬社群應用雲端技術進行資訊分析交流,快速地將各種最新資訊傳遞至個人隨身裝置,智慧型手機無疑是這一波發展中最重要推手。在智慧型行動裝置日漸普及的情況下,搭配3G連網以及日前已開台之4G高速行動網路,行動隨身連網已成為大多數人日常生活中的一部分,也因此專注於內容發展更是目前大多數數位內容開發者著眼的重要方向。本小組在分析目前行動裝置使用人口特性並且鎖定虛擬社群、知識交流以及3D動畫未來發展等三大項數位內容發展,目前以TOMO行動裝置虛擬社群實體化行動APPTourTube旅遊雲端知識推薦以及PreViz 3D動畫技術提供影視動態視覺化先驗服務為主要發展內容。

行動裝置虛擬社群實體化

Facebook尚未開始流行前,日本即以Mixi網路社群網站獨佔日本社群市場,但Mixi的登錄需要有日本當地行動電話號碼並搭配專屬的電子郵件帳號才能進行登錄,也因此造成日本以外的使用者進入門坎較高,而當Facebook推出之後,即以無登錄限制的方式打入日本市場。智慧型行動裝置普及,隨身裝置的個人化應用也勢必更專注在個人需求上進行發展,本團隊所發展之應用Tomo即是以互助出發,考量安全性,服務採實名化,以點對點接合架構設計,提供使用者需求媒合、揪團聯誼以及個人服務供應的發佈與交流平台。初期主要以校園為場域進行發展,如考前要找人共讀、上課筆記共享、外出旅遊共乘、購物採買共購、或是娛樂揪團夜唱夜遊等以共有、共享、共玩為出發點進行虛擬社團實體化的方式,讓人與人之間的虛擬連結轉化為實體幫助,預計經由深耕校園後發展至校外其他使用族群並經由使用資訊分析後發展更多共有共享服務。

雲端旅遊推薦知識共享最佳化

背包客個人旅遊衍然成為進幾年來個人旅行者的最愛,如歐洲旅行經常是一張火車票即走遍全歐洲,旅遊景點的個人化差異化亦逐漸加大,旅遊資訊的個人化以及行程規劃是許多熱愛旅遊的族群深為煩惱的事情,如能夠在觀看影像的同時得知喜愛的影片場景所在地,勢必能夠讓規劃旅遊景點時能夠產生更多的想法與樂趣。TourTube 是以分享出發,結合資訊技術讓使用者能從喜愛的影片景點中快速整理和建立旅遊規劃,實現旅遊資訊分享、個人化旅遊行程推薦、旅行觀光推廣的之目標。最終我們希望能成為second screen第二螢幕的應用,讓使用者無論在電影院電視機前電腦前,只要使用TourTube,就能即時得到第一手影片內所介紹之旅遊景點資訊,資訊內容除了經由專業旅遊達人提供之外更藉由網友經營提供私房旅遊資訊。

未來3D影視製作利器

好萊塢規模的大型製作所產生的影片視覺效果固然震撼,但大多數的影片製作都期望能夠將可降低花費成本以及時間成本以提高拍片效率,PreViz團隊目前由元智大學資訊傳播學系張世明老師所帶領在ASIAGRAPH Reallusion Award 2014奪得最佳故事獎,PreViz 全名應該是3D Pre-visualisation for digital film making,電影是高成本的工業,不論是以人工進行場景的搭建或是以3D動畫技術進行影像建構都是相當耗費人力物力的工作,百年來電影從業人員就不停改善流程與工具,希望能事先視覺化的方式將最後的成品進行呈現,進而節省拍攝過程中可能產生的高額重新拍攝或製作費用,PreViz利用3D視覺化的方式在影片拍攝前就能夠事先得知實際拍攝的流程以及可能產生的效果,藉以輔助影片拍攝使拍攝過程能夠更順暢。


圖片來源:感謝元智大學張世明老師、劉奕宏同學、張家豪同學、冀擎同學提


圖片來源:ASIAGRAPH Reallusion 2014 官方網站。

(作者:元智大學資訊傳播學系 江振維助理教授。Email: chenwei@saturn.yzu.edu.tw )

大數據領航員

 運用大數據資料分析  製造業邁向新紀元 
/簡廷因助理教授 (元智大學大數據與數位匯流創新中心)
如何運用大數據資料分析提升生產良率達到降低生產成本、提高產品品質的目標,一直是製造業廠商所重視的課題,但如何將這些資料整合在一起是一大挑戰。
根據行政院經濟部統計處統計,製造業在2014年第二季佔台灣GDP25%,對台灣經濟扮演重要的一環。但如今製造業面臨以下的挑戰:
1.  面對同業彼此的競爭,提升生產良率及提升產品品質是很重要的課題。
2.  消費者的胃口瞬息萬變使得每項產品的週期越來越短。
3.  不穩定的訂單使得備料存貨的控管受到挑戰。
基於以上幾點挑戰及問題,各家廠商均希望能找出一道破口,藉以提升自家的生產力及競爭力,「大數據資料分析」讓這些廠商找到了新的方向。

提升生產良率一直是製造業廠商重視的課題之一,在此介紹如何運用大數據資料分析提升生產良率達到降低生產成本、提高產品品質的目標。圖一為傳統檢測產品的流程。因檢測需另外支付檢測成本,所以一般廠商採用抽樣檢測的方式以降低成本。此外將產品從生產線移至檢測機做檢測需要一段時間,因此無法立即得知產品是否發生異常。在大數據時代,利用資料分析解決了以上問題,如圖二。在圖二中蒐集所有機台的偵測資料後,送至虛擬量測系統(virtual metrology system)進行分析得到預測的值。整個過程中無產品的運送,可立即得知目前生產線狀況;不用抽樣檢測即可得知所有產品狀況。藉由大數據分析,達到檢測成本的降低、產品品質的提升,大大提高廠商的競爭力。

圖 

製造業相關的資料類型主要可以分成下列幾個部分:產品資料、機台資料、量測資料、產品缺陷資料,如何將這些資料整合在一起是一大挑戰。雖然大部分的資料為結構化資料,但大量的遺漏值(missing value)、資料的高維度以及資料有前後時間因素……等,使得資料在整合及分析的困難度增加。近年來各國不管在學界、業界及政府機關,在相關的議題均投入了不少人力,為的就是希望利用相關技術來提高工廠效能,運用這些技術將製造業推向新紀元。
(作者:元智大數據與數位匯流創新中心簡廷因助理教授。Email: tinin@saturn.yzu.edu.tw )

大數據辭典

虛擬量測 virtual metrology system
利用機台偵測的參數資料並透過先前建立的預測模型來預測產品的品質,整個過程中無需實際量測即可達到製程品質的監控。(簡廷因助理教授提供)

結構化資料structured data
資料有著固定的欄位及記錄。關聯式資料庫、EXCEL試算表均為結構化資料。(簡廷因助理教授提供)

大數據報報



LinkedIn用大數據顛覆招聘歷史
LinkedIn用大數據顛覆過去招聘舊思維,透過將大量企業和專業人士匯集在一個平臺上,不難看出LinkedIn正在朝「全球人才庫」邁進,更令人驚嘆的是未來將會建立全球經濟圖譜,透過圖譜能更精確掌握雇主與應聘者的匹配程度。【北京新浪網/2014-08-19全文
勝負有根據,IBM官方大數據App幫你預測美國網球公開賽
有別於過去以經驗預測賽事,現在IBM開發官方AppUS Open Tennis Championships」,球迷即可隨時接收最新戰況。IBM結合社群、行動、智慧分析及雲端科技對每場賽事進行大數據分析,精確掌握賽是致勝關鍵。【數位時代/2014-08-25全文
別懷疑,你就是大數據思維起點
大數據的發展無非是更貼近使用者需求,從用戶行為中發展出一條可循的脈絡,並在最終形成有價訊息達到精確預測。抽絲剝繭後,大數據就是若干個「我」所匯集起來的「我們」。而「我們」就合力成為海量需求,而海量需求就是有價值的數據包。【北京新浪網/2014-09-02全文
物聯網將促成數位商業時代的誕生
根據2014 Gartner新興技術發展周期(Hype Cycle for Emerging Technologies)報告指出,物聯網已正式取代大資料成為全球最熱門的資訊科技技術。【iThome/2014-09-07全文
如何猜出你的購買欲, 讓eBay帶你看清大數據內幕
eBay平臺每天幾乎每秒都要處理數千美元。目前eBay掌握用戶的行為模式,使搜索引擎更加「直覺化」。基於用戶過去購物數據,eBay不只會提供情報給商家,也提供資訊給製造商,例如,用戶正在搜尋的商品,讓製造商及時做出反應。【鉅亨網/2014-09-08全文
Gmail無隱私? 近500萬筆帳號密碼遭駭
根據俄羅斯網站 CNews 9 10 日指出,約有 493 萬組 Gmail 帳號和密碼被人在一個俄羅斯的比特幣論壇上公布。9 9 日時俄羅斯最大的搜尋引擎 Yandex 也被公布了 126 萬組帳號密碼。【INSIDE/2014/09/11全文Google對此發出聲明,表示帳密外洩並非因為公司系統被入侵,而是因為「憑證傾倒」(credential dumps)所致。【中時電子報/2014-09-12全文
企業新趨勢,用大數據植入智商
比起大數據所帶來的技術性挑戰,更大的難題來自於決策的變化,迎面而來的問題如數據分析會直接影響組織怎樣做決策、誰來做決策,從而減弱個人的權威性。大數據不僅僅是改變人們做決策的內容和方向,對管理者的知識結構和分析能力也會提出更高的要求。【北京新浪網/2014-09-12全文
可穿戴設備其實不智慧,精準度、大數據隱私問題待解
有「可穿戴設備之父」的彭特蘭指出,目前可穿戴設備的精準度有著嚴重缺陷,對於多數人關心的隱私問題也有相當的安全疑慮。對此,彭特蘭認為解決大數據隱私問題關鍵在於誰掌控數據。【生物谷/2014-09-16全文
大陸早在雲端噴金 台灣去哪了
15年前阿里巴巴就開始充分運用大數據分析追蹤顧客喜好進行「精準行銷」並創造無限商機。最引人注目的「雙十一光棍節」,一天內平台交易額為191億人民幣,7800萬個包裹因而產生。台灣在大數據分析技術上已明顯落後大陸,需要大家共同努力。【中國時報/2014-09-17全文
誰最想被忘記? 「忘記」真的是希望的出口嗎?
歐洲法院判決要求Google必須按網路使用者的要求,關掉不堪回首的過去,但我們卻經常有Google找不到的就不存在於世界的錯覺。為避開過去的恐懼,忘記可能是希望的出口,但今日被遺忘卻可能代表真正的死亡。【科技橘報/2014-09-26全文
大數據時代,蘋果迷隱私堪憂
iCloud受到濫用的原因有二:一是駭客利用「尋找我的iPhone」功能漏洞;另一個原因是鮮少用戶會在訂購網路服務按下「同意」前仔細閱讀軟體提供的法律條款。對用戶來說,最安全的方法莫過於不將私密資料放在雲端,才能保有個人隱私。【Bloomberg View/2014/09/02全文
2014台灣資訊社會研究學會年會暨論文研討會
一年一度的台灣資訊社會研究學會年會暨論文研討會,今年主題為「新媒體與公民運動」,邀請Professor Carolyn A. Lin蒞臨演講;本次研討會之專題討論分別為:
1. Big Data與資訊社會分析
2.數位匯流法規政策與個資隱私(此議題與本中心合辦)
3.資通訊科技應用與原住民文化傳播
4.永續環境、科技發展策略與產業創新。
研討會將於20141115日於國立交通大學客家文化學院盛大舉行。 會議網站

INTERNATIONAL TELECOMMUNICATION SOCIETY (ITS) BIENNIAL CONFERENCE 2014

ITS 提供平台給學術界、私部門及政府單位進行交流。發現新議題、分享研究成果並形成新的關係和方法,以及解決尚未解決的問題是此研討會的功能。ITS著重於持續演進的應用程序,服務,技術,通訊,運算,互聯網,信息內容,及相關產業的基礎設施。今年雙年會所討論的主題是The Net and the Internet: Emerging Markets and Policies,分為五大主軸向全球各地邀稿:
1. Infrastructure layer (the “net”)
2. Logical and application layers (theInternet”)
3. Content layer
4. Internet policy and governance
5. Beyond telecoms: the transformational power of IT)
研討會將於20141130日至2014123日於巴西里約熱內盧舉行。本中心數位匯流政策法規研究團隊成員周韻采副教授及葉志良助理教授將前往參與。會議網站