主題亮點 ─ 資料去重複技術裡的安全議題

Security issues in data deduplication techniques
背景

目前最被大眾所接受的雲端服務就非雲端儲存 (cloud storage) 莫屬了。Cloud storage所提供的服務就是提供使用者 (user) 儲存空間讓user能夠備份上傳他們的資料,並且進行雲端與user所持有的不同裝置做資料同步。目前著名的cloud storage包含Bitcasa (https://www.bitcasa.com/)Dropbox (https://www.dropbox.com/)Google Drive(https://www.google.com/drive/)Microsoft One Drive (https://onedrive.live.com/)SpiderOak (https://spideroak.com/)Wuala (https://www.wuala.com/)等。這些cloud storage的一個共同特徵就是都會給予未付費使用者 (free user) 一定程度的免費儲存空間 (free space)。譬如Dropbox會給予2GBfree spaceGoogle Drive會給予15GBfree spaceFree user即可隨意使用這些free space來儲存備份資料。但是cloud storage要如何精簡且有效率地儲存user所上傳的資料則是個大問題。這是因為除了付費使用者的資料當然得妥善保存之外,現在的free user往往都會註冊多個cloud  storage的帳號來多獲取一些free space,而雖為free user的資料,但是cloud storage仍不能讓其漏失,以上種種都加重了雲端儲存營運者 (cloud storage administrator) 的儲存成本 (storage cost)

資料去重複技術的各種分類
就以data deduplication來說,雖然其背後的原理只是「不要將相同的資料重複儲存」,但是就以實際上各種應用的data deduplication實作來說,則會有不同的分類方式。在此,我們考慮一個可能會是多人使用的cloud storageDropbox,在這樣的cloud storage上面,首先,可以針對「是否對於不同user的資料來進行data deduplication」來做分類。如果只能對個別user account內的資料進行data deduplication的話,即稱之為 single user data deduplication,而若是可以把所有user account內的資料一併考慮進去,統一進行data deduplication的話,即稱之為crosse user data deduplication (或又稱global data deduplication)。根據「資料上傳者是否會得知上傳的資料已經有重複」來區分的話,將可以區分成server-sideclient-side data deduplication兩種。就以前者來說,user想上傳資料的話就直接進行上傳,而由cloud storage來決定是否儲存剛獲得上傳的資料。而以後者來說,user在實際上傳資料之前,會先計算對應於資料的deduplication tag,並且先將deduplication tag上傳至cloud storageCloud storage在經由deduplication tag的比對來確認是否已經存有對應的資料之後,會通知user是否需要再上傳資料。其中,deduplication tagfile-based data deduplication是採用完整檔案下去做如SHA256hash,而在chunk-based data deduplication時則是用各chunk下去做hash。可以知道,因為如果cloud storage已經存有對應資料了,則甚至資料不用再被重複傳輸,因此,client-side data deduplication是一個除了可以獲得storage saving之外,還可以獲得bandwidth saving的作法。

目前許多cloud storage為了節省storage cost,也為了bandwidth saving與提昇使用者滿意度,均採用cross-user chunk-based client-side data deduplication。譬如WualaDropbox就是使用chunk size固定為4MB,且hash functionSHA256cross-user chunk-based client-side data deduplication。因為chunk-based這個特性不好被畫出來且和將討論的安全議題無關,我們先以下圖來表示cross-user client-side data deduplication的運作方式。首先,在圖一(a)時,user 1想上傳F1F2兩個檔案,首先,user 1先算出並上傳h(F1)h(F2)兩個deduplication tag,這裡假設cloud storage還沒有F1F2的複本,所以cloud storage傳回兩個negative ACK (圖中以0表示) 通知user 1繼續完整上傳F1F2。接著,在圖一(b)當中,user 2想上傳F1F3兩個檔案,user 2算出並上傳h(F1)h(F3)兩個deduplication tag,因cloud storage已有F1,所以cloud storage傳回一個negative ACK 與一個positive ACK (圖中以1表示) 通知user 2只需完整上傳F3即可。這裡可以看出,雖然從user的觀點來看,deduplication tag的傳輸都是多餘的,但是卻可以藉此得知資料是否已經存在cloud storage並獲得更多的storage saving
圖一:Cross-user client-side data deduplication的運作範例

安全與隱私顧慮
2010年開始有研究指出,具有data deuplication,尤其是cross-user client-side data deduplicationcloud storage (以下簡稱deduplicated cloud storage) 雖然可以獲得storagebandwidth saving但是也多了安全與隱私上的顧慮。譬如從圖二(a)可以看出,攻擊者可以藉由上傳可能的hash 以及觀察deduplicated cloud storage所做的回應來獲知對應的檔案是否已經存在於deduplicated cloud storage內,導致檔案的隱私性被破壞。而從圖二(b)可以看出deduplicated cloud storage會被濫用而成為一種covert channel。更仔細一點地來說,譬如兩個攻擊者之間的通訊若是被監聽,而假設他們事前已經同意一個共同的檔案,則他們藉由上傳或是刪除那個共同檔案,換言之,經由deduplicated cloud storage內那個共同檔案的存在與否,則可以建立起一個low-bandwidthcovert channel來進行秘密傳輸而不被發現傳輸正在進行當中。


圖二:各種deduplicated cloud storage不一樣的安全與隱私攻擊

而從圖二 (c)可以看出deduplicated cloud storage會被濫用而成為一種CDN (Content Delivery Network)來協助檔案的分配傳送。這樣的情況最常出現在不特定的多人想要共同分享同一份大檔案。因為是大檔案,所以無法經由一般的email附件來傳送。而假設攻擊者又不想付費取得相對應的storagebandwidth資源,所以原始的資料擁有者可以先上傳想分享的資料至deduplicated cloud storage,然後將相對應的deduplication tag傳遞給其他人。此時,收到deduplication tag的人假裝他仍要上傳同一份資料,並且也給予deduplicated cloud storage那些deduplication tag。在看到相同的deduplication tag之後,deduplicated cloud storage會認為此時上傳deduplication tag的人也只是恰好擁有相同資料,而中斷資料的傳輸並讓此人獲得資料的擁有權。至此,此人即可順利下載資料,且以deduplicated cloud storage的角度來看,他只是下載自己的資料,並不算在需要付費的頻寬限制之內。這樣的攻擊並不僅只是研究人員的想像,已經有一套open sourcesoftware稱為Dropship被開發出來,可以利用Dropboxdeduplicatio技術來進行這樣的cloud storage濫用。

還有,從圖二 (d)可以看出deduplicated cloud storage上的資料也有可能被攻擊者所惡意下載。這裡是說,如果攻擊者想下載某份檔案,但恰巧只擁有檔案的deduplication tag的話,即可利用類似上述方法,攻擊者先假裝自己要上傳檔案,藉此來獲取檔案的擁有權,之後再逕行下載即可獲得本不屬於攻擊者的檔案。

解決方法
回顧我們在圖二所闡述的關於deduplicated cloud storage所遇到各種安全與隱私問題,從2010年開始,有研究人員提出Proof of Ownership (POW)的概念來解決data deduplication的安全問題。觀察到圖二的問題主要是攻擊者都利用了「上傳同樣的hash之後,deduplicated cloud storage即會不加以檢查而直接認為上傳hashuser是擁有對應的資料」的這樣弱點,POW就針對這樣關於data deduplication的弱點加以防護;POW scheme當中,一旦有user上傳了deduplicated cloud storage內已經有的deduplication tag之後,deduplicated cloud storage將會在連結對應檔案與user之前,先隨機要求user回傳檔案內的幾個bit。如果user能順利回答那幾個bit0或是1,則deduplicated cloud storage相信user真的是擁有對應資料。反之,若是user無法順利回答那幾個bit0或是1,則deduplicated cloud storage認為方才上傳deduplication taguser是攻擊者,只想騙取檔案的所有權。而有些POW則是觀察到deduplication tag的計算需要過多I/O,但是用於client-side data deduplication判別是否有無資料存在於deduplicated cloud storage中的deduplication tag其實並不需要一般如MD5或是SHA1般的繁複計算量。因此,一些 POW 各自提出一個並非cryptographic use而有collisionhash function,能大幅降低計算hash所需的時間,藉此來提升 POW scheme 的效能。
(本文由本中心游家牧教授提供)


主題亮點 ─ 應用大數據於交通運輸

應用大數據於交通運輸
Big Data Applications on Intelligent Transportation
隨著物聯網熱潮迅速漫延,車聯網概念的興起是引領交通運輸智慧化的創新關鍵,從現在開始,汽車不單只是交通運輸工具,其可望變身為一個獨立暨龐大的行動裝置,為智慧交通系統(ITS)開起革命性的進化,蓄勢爆發的能量不容小覷。
圖三:計程車GPS軌跡
元智大學大數據中心的智慧交通運輸團隊利用大數據分析處理技術,挖掘交通大數據在發展智慧城市的各種應用;該團隊表示,目前正積極的與桃園縣交通局合作,藉由交通局提供桃園縣各公車的行車資料,包含公車車號、行駛路線及GPS定位資料、以及各路口的號誌資料,方便後續發展節能減碳及省時路徑規劃方面的應用,並期待以大數據技術精準預測公車到站時間。除此之外,該團隊為增加數據資料的多樣性,同時與桃園縣計程車公會合作,取得桃園縣近2000輛計程車的行車資料,包含車輛GPS經緯度、載客狀態、日期等,其中部分計程車裝置OBD (車上診斷系統),目前APP可以抓取車中的25項資訊,最多能同在頁面中顯示出六項資料出來,能夠讓使用者自行變更顯示方塊的顏色以及想要顯示的資訊,在功能上目前如果有數數值異常時,顯示數執會變成紅色提醒駕駛,例如水溫過高時,數值會呈現紅色警示駕駛(如下圖四)

圖四:OBD2 APP示意圖
除此之外,該團隊亦積極開發車載自動診斷系統(OBD2),目前OBD2可監控的即時行車狀況多達80幾種,包括有行車速度、引擎轉速、冷卻水溫及電瓶電壓等,但經過研讀與篩選並以實際行車測試後,共篩選出可以取得的31項行車資料項目如燃油系統狀態、引擎負荷值、引擎運轉時間、加速踏板距離、噴油時間等。藉由車上OBD2的設置,可以收集更多樣的行車資料如行車車速及油耗資料等,這些資料的蒐集、裝置成本的投入皆是為了研發另一個技術核心亮點─智慧綠能行車系統。

圖五:省時省油路徑規劃操作介面
在透過以上公私部門(公車定位資料與計程車駕駛資料)雙管齊下的資料蒐集,可以估算大桃園地區各道路的行車路況,該團隊目前進行此方面的資料蒐集是為了發展比Google map或導航王更為智慧更為貼心的智慧綠能行車系統,此系統含括了省時路徑導航、省油路徑規劃、停等紅綠燈油耗分析等研發;在省時路徑導航部分,是以行車歷史資料作為規劃行車路徑的依據,再利用行車數據進行切割與組合,進而產生最佳X條路徑,供駕駛人即時選擇耗時極小化的路線。再者,省油路徑規劃與停等紅綠燈油耗分析的研發概念是接近的,是利用車載機OBD2所回傳的油耗資訊,進行行車路徑時間以及行車耗油量的預估,據此提供駕駛人最佳的省油路徑規劃,在這油價不斷喊漲的時代,省油等於省下荷包,其應用價值預期可提供計程車業者提升營運品質與效率或地方機關進行道路規畫等,除此之外,亦能為地球帶來節能減碳的高效益。

智慧綠能行車系統的研發主要是應用在駕駛人可以透過該系統的服務知道哪一區段路線是較為壅塞的或是有交通事故、道路施工等情況發生,用路人可以即時的判斷進行選擇避免更為耗時、耗油的替代路線。然而,智慧綠能行車系統的發展,除了為駕駛人帶來省時省油的經濟效益之外,亦為駕駛人帶來更順心、更舒適的行車體驗。

為了瞭解甚至預測交通現象,本團隊也正在研究交通模型,其中包含離散的細胞自動機(cellular automaton)模型與連續模型,這些模型有助於瞭解壅塞情形之傳遞、平衡狀態之穩定性等,目前這些模型的研究幾乎都是靠統計物理學家利用人造資料進行模擬,本團隊則冀望在資料密度夠高後,能夠首創以真實資料搭配這些模型,進而預測交通。

本團隊也關注最大流量(maximum flow)問題,這個問題問的是在一個網路中,如何最大化起點至終點的最大流量,同時不讓任何一條道路超過其負荷量,作為演算法領域研究幾十年的基礎問題,要在這個問題上再取得突破極為困難,但前年麻省理工學院的Orlin教授有一篇重大的演算法突破,可將此問題的時間複雜度壓到正比於點數和邊數之積,本團隊正在研究是否有可能為這個新的演算法找到交通上的應用。
(本文由本中心智慧交通運輸團隊提供)



InnoBic「OTT科技創新與市場顛覆」論壇

隨數位匯流時代來臨,OTT(Over The Top)在台灣發展已到關鍵時刻,許多線上服務皆能取代傳統語音電話、簡訊,甚至影視內容的觀賞,更顛覆過去使用者的行為模式。由於OTT是架構在網路運營商提供的網路之上的服務業務,幾乎無需電信業者另外提供技術支撐,因此OTT已逐漸侵蝕傳統業務,儼然成為電信與廣電產業一大威脅。在OTT蓬勃發展的背後,所迎來問題和面臨的挑戰,均值得我們深入討論。

有鑑於此,本中心政策法規團隊邀集產官學界針對OTT的技術發展、管制挑戰、服務創新與未來展望,各自提出看法與期待。本論壇採兩階段進行:上午場次擬邀請對OTT有相當研究之產官學研者,共同探討OTT的技術發展以及對管制機關的挑戰;下午場次則特別針對OTT服務,分別討論OTT對傳統通傳產業所造成之影響及挑戰,擬邀請產業界人士(規劃電信與有線電視業者)一同共襄盛舉並提出高見。並藉此論壇平台帶動產業交流,並對台灣OTT市場發展種種問題進行更為深入的意見交換。場次主題如下:第一場為OTT技術發展與服務創新、第二場 為OTT對管制機關的挑戰、第三場為OTT服務對市場的競爭與裂解、第四場為OTT服務對產業的挑戰與期待。

本校張進福長於開幕致詞時表示,OTT目前在全球蓬勃發展,許多廣播電視業者也由競爭轉而與OTT業者互相合作,但規管都屬於灰色地帶,因為OTT產業的科技、服務、法規都屬於匯流科技趨勢下的整合產物,若是用既有架構,就必須重新定義,若以新的規範則可能有規管強度不一致的疑慮,因此,張校長認為,論壇作為第三方的平台,可以讓各界人士一起討論,並提供建議給我國的主管機關參考。


第一場「OTT技術發展與服務創新」由電信技術中心李大嵩董事長主持。首先,行政院科技會報辦公室黃彥男副執行秘書表示,國內OTT現況改變了消費者使用行為,文字和影音等媒體內容之呈現早有別於以往,使用者可透過社群媒體、串流平台、視頻平台以及整合平台APP收看媒體內容,另外他也認為台灣在資訊基礎設施還算建全,業者的投入也相當積極,如凱擘「Super MOD」,他建議政府應該投入更多資源,如將網路影音發展放入國家政策、培養發展網路平台之技術人才、協助國內外OTT市場的接軌,改善頻寬收費過高問題。國立暨大魏學文教授針對OTT技術面進行歸納,他認為在4K UHD時代下,消費者對於高品質影音需求不容小覷。OTT TV發展基礎皆已就緒,如內容、影音品質、價格、行動裝置便利性等,此外他認為智慧型手機的普遍性,將為OTT TV帶來一股強大的推力。資策會智通所劉文山副主任則認為,OTT成為趨勢的主因是消費者需求所致,閱聽者可在任何時間、任何地點、用任何裝置去收視喜愛的節目,數位匯流帶來多螢整合以及各式的影音串流技術之發展;另外他舉出Netflix OTT業者的快速興起的原因,以及如何以CDN解決頻寬塞車問題。源思科技黃肇嘉總經理認為OTT具有五大特點:開放資料、操作服務、介面、數據探勘、大規模的規劃,他認為OTT是一個創新的營運模式,成功地打造全新的體驗感受、無需受限於國界。

第二場「OTT 對管制機關造成的挑戰」由政治大學新聞學系蘇蘅教授主持。首先台北大學劉崇堅教授認為,電信業者與OTT 業者間具有一種互利共生關係,OTT 的成長帶給全世界通信業者威脅與機會,它分食了通信業者的語音、簡訊、IPTV等市場,他表示管制機關未來可能面對包括競爭公平性、頻道內容以及國家利益等問題,建議應如歐盟數位議程召集人Ansip所言:平衡電信業者與OTT 業者間的關係,以確保整備寬頻通信網路所需之財源。元智大學葉志良教授表示,管制論中「相同服務應受相同管制」的等號關係已開始質變,因為OTT所處的環境並非當初廣電法所描繪的環境,未來也不知道會出現甚麼樣的法律來規範OTT,這對管制機關而言是很大的挑戰;另外與OTT管制有相當關係的網路中立性,他表示美國目前的管制規範仍有相當大的爭議,其中付費互連(paid peering)可能與網路中立所禁止的付費優先權(paid prioritization)有著相當曖昧的關係,要如何區分對管制機關來說挑戰極大;最後他說明要建立健康發展的OTT平台並非想像中的容易,必須本身有可看性高且「合法授權」的內容,才有本錢跟國外OTT洽談交換授權的後續動作。電信技術中心陳人傑研究員分享德國針對OTT的管制經驗,他說明德國通訊傳播管制架構下,OTT屬於廣電法管制下的廣電平台,並可分為一般平台與優惠平台,其中優惠平臺給予輕度管制;另外,他認為OTT視訊平臺無須納入事前管制,原因包括OTT性質上為開放平臺,進入市場容易而不易有壟斷力量、無服務品質保證,以及僅需負擔一般管制義務。台灣經濟研究院劉柏立所長則說明OTT是一種藉由網際網路提供實體或線上串流播送方式的數位內容(音樂或電影)之出租或販售的一種創新服務,如iTunesNetflixHulu等。另外,他也說明擴大IP訊務量有三項重要意義,包括寬頻網路建設之實現、數位匯流服務之實現、國際競爭優勢之追求。他認為能夠提供業者擴大IP訊務量的發展環境,才是理想的匯流大法修法方向。衛星廣電事業商業同業公會鍾瑞昌秘書長引用蘇蘅老師名句「手機列車要開了,誰會留在月台」,進而帶出產業界的徬徨。他說明OTT對內容的挑戰有二個,包括網路內容侵權顧慮以及網路內容與傳統內容不對稱管制。他呼籲應該在努力建設寬頻環境之餘,仍應處理內容侵權問題,以及拉近開放網路與封閉性管制的落差,以符公平正義原則。

第三場「OTT 服務對市場的競爭與裂解」由政治大學劉幼琍特聘教授擔任主持人。國家通訊傳播委員會彭心儀委員針對OTT TV對市場衝擊之政策解決方向提出兩大建議,其一是不要求最嚴格的網路中立,原則上應符合經濟邏輯的「速度與流量」市場機制、從寬解釋「合理的網路管理」、有條件允許付費優先;其二是要求OTT業者在地化及(低度)法制(法治)化,原則上境外OTT應落地處理,遵守包括租稅等一般法律規範、以低度管制的執照將國內外OTT納入通訊傳播管制架構,具執照者可以協商流量優先權,確保服務品質。台灣國際影視基金會朱程吾執行長則認為,盜版猖獗問題嚴重,消費者收視選擇已經跨越國界,呼籲政府應重視保護創作者著作權利,並提出相關解決辦法。台塑OTT事業黃耀德執行長認為,要成就數位媒體是不能單打獨鬥的,必需異業合作、資源整合、共存共榮才能激發更多新媒體服務的可能性,以促進各行業運用新媒體的可行性,同時也啟動企業轉型或跨界、跨業合作的關鍵。中嘉網路劉建志法務長表示OTT服務帶來行動收視新思維,OTT服務帶來入口平台式應用的改變,未來將會是視訊數位平台之OTT;另外OTT服務帶來網路流量成本結構革命,他更表示成功的OTT付費模式,取決於「流量計價」與「網路盜版邊境管制」。台灣通訊學會許文宜秘書長則認為,OTT服務對市場的競爭效應要思考諸如通傳市場競爭議題與新興視訊監理政策、視訊市場垂直、水平、跨業整合議題、視訊市場界定及影響力評估指標、節目供應者與視訊平臺、前瞻性寬頻管理政策、新興媒體內容治理、市場公平競爭、消費者權益保護問題等。


第四場「OTT 服務對產業的挑戰與期待」由元智大學彭芸教授主持。景文科技大學教授莊春發教授說明OTT與傳統視訊產業屬性的比較,差別在於OTT沒有地理上的限制,OTT僅租用其他業者的網路,OTT不易提供地方新聞內容,主要提供娛樂節目的功能;他更強調OTT對有線電視產業是有威脅但不會完全取代;OTT對視訊產業的衝擊有多少,應視OTT內容的精進與演化;衝擊有多嚴重,應視消費者接受的程度與發展;他呼籲OTT節目的取得須以合法為前提,使不同視訊平台間能夠在公平底下競爭。中華電信行銷處馬宏燦副總經理先定義OTT服務,是在網路環境中透過網路傳輸,在各式各樣終端上提供的各種服務,OTT帶來的是消費者行為的改變,OTT影視服務造成大量網路流量和成本,其中最讓電信業者擔心的是面臨跨國、跨平台的競爭者。香港琥烽百視台灣公司張成軍總經理則表示,OTT服務將由境外服務商主導,並為OTT產業在全球的角色做定位,其中又以西邊中國的供應量最大(例如愛奇藝、風行)、付費服務來自東邊美國(例如Netflix, Amazon Prime, HBO Now),本地OTT服務是配角,幾乎沒有能獲利的營運模式。台灣大哥大新創服務李芃君副總經理說明數位音樂產業新趨勢、線上影音市場以及數位閱讀產業現況,每項數據調查都顯示出數位內容產業的具有相當大挑戰。三立電視台行動媒體部林慧珍副總經理則說明三立新媒體因應OTT服務所帶來的挑戰,積極做出很多嘗試,例如O2O、網台互動、線上演唱會、馬拉松比賽、直播新聞時事,三立表態應以粉絲為核心,去做更多的延伸並期許提供更完整服務。遠傳電信企業暨國際事業群李明憲副總經理則指出,OTT產業需要大量的基礎建設包含網路通訊、運算、儲存等才能做更多的拓展,寬頻普及使網路傳輸速度提升,帶動各類業者利用電信網路拓展互聯網應用服務,電信商將面臨價值萎縮與邊緣化的挑戰等衝擊,因此在匯流浪潮下勢必需要重新定位電信業的角色。台灣有線寬頻產業協會秘書長彭淑芬則認為所有媒體都在往新媒體的路上,從產業內競爭到產業間競合,她針對匯流政策及法令提出一些建議,諸如政府通傳政策必須以尊重和保護智慧財產權為核心,才能鼓勵本土文創產業產製好的內容,另外也強調電信多媒體傳輸平台、網路視頻等與有線電視,既然提供相同服務也應以相同管制強度規管,以維持視訊市場的公平競爭,若不對網路視頻加以規管,也建請對有線電視產業規管鬆綁,以提升媒體產業發展為施政目標。

匯流政策時論

國道整合平面 大數據讓塞車資訊有感
清明連假再讓駕駛人體會國道五號塞車的慘況,交通部長陳建宇節前許諾「台北到羅東九十分鐘」,成為民眾批判的焦點。平心而論,馬團隊執政已接近尾聲,毛院長曾任交通部長多年,內閣團隊又有不少出身於交通界,竟連這種芝麻小事都未能處理好,怎能期望提出有感的施政績效?

當前駕駛人對於道路訊息的掌握,一是來自警察廣播電台的路況轉播,部分資訊也還算即時,問題在於不夠完整;另一則是1968行動軟體,但過於簡單、不實用,更要命的是未能整合平面道路的訊息,導致駕駛人欠缺資訊,如同盲人摸象,誤入車陣中,自討沒趣。「解鈴還需繫鈴人」,道路擁擠肇因於駕駛人對堵車資訊的不瞭解,或掌握的資訊過時或錯誤,解決之道自然是如何讓駕駛人提前知悉道路車流訊息,避免誤入塞車路段。毛院長最近射出的「科技三箭」—大數據、資料開放與群眾外包,可以應用到這個案例上。

首先,建議交通部將國道車輛監視系統與eTag資料予以公布,號召全國賢達之士針對這些資訊加以系統分析,希望能為駕駛人提供有用、有感與有價值的資訊,並予以視覺化、即時化與細緻化,讓駕駛人可以隨時查詢,以掌握最新交通資訊,從而做出適當的駕駛決定。
應該提供何種資訊給駕駛人?交通部長未來應公布兩項數據:一是平面道路及國道行駛整體時間,二是國道主線行駛時間。但本人同意台北捷運公司董事長賀陳旦的看法,高公局多年來公布的「單日總車流量」,沒有比較基礎,對於駕駛人毫無意義,建議應該公布「塞車機率」,透過大數據的分析應該可以達成這個目標。
國道擁有豐富的車流量資訊,但尚未能整合平面道路資訊,因此,如何與地方政府合作,在國道交流道與各地方政府旅遊景點的重要路口裝置感測技術,並與自動化、資通訊技術結合,形成一個以大數據為主的智慧交通系統,恐怕是未來必須要有的智慧道路系統。

目前因物聯網的發達,導入各式感測技術、雲端技術與大數據分析後,將可為駕駛人產生更有價值的多元交通資訊。歐美國家早預估大數據、物聯網、雲端計算將與即時交通信息系統逐步融合,讓人民享受更方便、更快捷與更安全的旅遊和運輸服務,大陸一級與二級城市在此方面的快速進展,更是令人刮目相看。中國的車流量動輒以千萬量起跳,台灣不過是難得一次的三百萬輛就搞得雞飛狗跳,內閣團隊真的必須好好思考對策,挽回施政信心。(全文)
( 本文作者:本中心丘昌泰教授。中時電子報/2015-04-09 )
媒體評論-台灣為何沒有紙牌屋
Netflix自製的影集《紙牌屋》第3季又開播了,這是台灣研究新媒體的人最喜歡列舉的例子之一。識者謂Netflix善用消費者資料做分析,找出凱文史貝西和華盛頓政治是觀眾喜愛的演員與題材,於是將他們結合,創造了叫好又叫座的影集,帶動消費者訂購Netflix的熱潮,是大數據結合新媒體的典範。

我認為《紙牌屋》的成功在編劇。很多人以為《紙牌屋》只是改編90年代英國同名影集而已,其實不然。英美兩國縱使國情相近,國會運作卻差異頗大。英國是內閣制,國會議員的合縱連橫即代表權力運作;相對地,美國的總統制使得描寫國會運作時,仍必須拉出一條白宮軸線,以呈現權力運作的完整性。又美國國會議員(特別指眾議員)因是小選區制,且兩年一選,所以選區經營很重要,通常周末都必須回到選區服務,但英國國會議員因有較長任期保障,不須頻繁往返選區。這些體制差異鋪陳在劇情細節裏,讓曾經與美國國會有深度交流的我,感覺描寫到位,看得津津有味。例如第一季裏描寫Underwood的選區民眾不慎撞上他爭取建設的大水塔而身亡,Underwood只得放下正在協商的教育法案,趕回選區安撫憤怒的家屬與居民,同時一面遙控國會裡的法案協商。觀眾看著國會議員得時時面對高層政治與底層政治的交錯,不禁莞爾。
而《紙牌屋》的編劇Beau Willimon不僅僅是影劇圈人士而已,他曾經參與過希拉蕊2000年的參議員選舉,2004年也再度進入民主黨候選人Howard Dean問鼎白宮的競選團隊。而他的成名作,Farragut North舞台劇,即是根據他擔任Howard Dean新聞助理的所見所聞而來。Farragut North後來被喬治庫隆尼改拍成電影《選戰風雲》(Ides of March),被認為是近來少見的深度刻畫選舉的政治電影。他之前的政治經歷無疑地讓他能精準地描繪國會生態,而又能呈現戲劇張力,使《紙牌屋》較其他政治影集如《白宮風雲》《白宮女總統》更有深度與熱度,難怪甫一推出就吸引許多粉絲。在美國這種跨界人士越來越受主流影業的重視。在Youtube一天新增內容高達百萬則的時代,既有政治歷練又懂劇本寫作的人,才能創作深刻到位的政治劇,進而令觀眾目眩神迷。

反觀華人世界,儘管現實的政治鬥爭也是高潮迭起,但卻沒有產出叫好叫座的政治電影。記憶中勉強算描寫台灣選舉的電影應是梁家輝主演的《情義之西西里島》,卻還是由香港人麥當傑執導的。前年9月,台北的天空浮著一層謎一樣的霧,人們一度懷疑立法院會不會從此不一樣了,延續到去年太陽花學運,那些百百千千的青春在青島東路舞動著,相遇再離去。

我想像著,像《Vantage Point》的多線劇情一樣,不同畫面分別呈現在立法院的人、總統府的人及第一線架拒馬的人面對一波波的人潮襲來,他們當下在想什麼及做了什麼。這需要內圈參與者發揮文青功力,才能將驚心動魄的危機處理轉化成有戲劇張力的影像。台灣若要發展成為華語影音的重鎮,應鼓勵大量的跨界與換軌投入,讓專業人士能進行創作,反過來文青也應有其他的專業歷練,如此才能創作深刻到位的劇情吸引觀眾,否則我們只賸下豬哥亮與九把刀。(全文)
(本文作者:本中心周韻采教授。中時電子報/2015-04-10
媒體評論-誠品百貨公司
寒暑假時我都帶小孩去松菸或華山文創園區看當季的展覽,雖然大部分的展覽商業氣息太重,但作為幼兒親近文藝創作的啟蒙也還勉強過得去。主要好處是園區裡有一片空地及草坪,足以讓小孩舒展筋骨,消磨大半午後。但我絕對不進松菸誠品買書。對我來說,那不是書店,充其量是有書的百貨公司。尤其是書店讓位給商品空間後,殘存的一隅也布滿了所謂的暢銷書或名人書,完全無法有佇足翻閱的慾望。

我以為在文創園區裡的書店應陳列完整但已停刊的《當代》、《影響》、或早期的《電影欣賞》,還有遠流一系列翻譯西方思潮的叢書。在80年代的後解嚴時期,這些書曾經是我們汲取藝文的養分,讓我們在騷動的青春裡,有了安靜的力量。但遺憾地,松菸誠品卻寧願退居成賣場的裝飾而自得。不要誤解,我還是買書的。但若要買專業的原文書籍,我直接上亞馬遜網站訂購。如果要買當季中文書,就趁去好市多時逛逛它的書籍區。是的,當你可以在好市多以75折買到皮凱提的《21世紀資本論》,誠品的價值在哪裡?就如同貴婦人去微風超市,誠品彰顯了偽文青的身分。

當年北市府以BOT方式開發松菸文創園區的條件有二,一是市府出資修復老舊廠房,轉作展覽空間;二是BOT廠商出資另建一新量體,作為文創業者的育成中心。我曾在內部會議中表達信義誠品已顯示誠品未來的走向,商業大於藝文,坐收店租,是否有能力育成文創業者,不無疑義。但當時放眼望去,也找不到比誠品更響亮的藝文品牌,會比較成功,所以台灣大哥大的子公司台北文創加誠品的團隊便得標了。8年過去了,新量體早已蓋好營運了,B24樓皆是賣場,書店、電影院及小劇場偏居一隅,4樓以上則是標榜五星級的旅館。噢,還有台灣大哥大的總部全員入駐。唯一遺失的是最屬於文創產業的育成中心。台灣大哥大宣稱其營業登記項目包含文創,故屬文創事業。但是台灣大哥大的資本支出有多少比例是專款投入在文創呢?其員工專職於文創業務的又占總數比例多少呢?如果其文創營業額只占總營業額的一小部分比例,卻還堅稱自己是文創業者,無異自欺欺人。

近來輿論對各文創園區的非文創現象已多所討論,誠品支持者或謂實體書店的不景氣是全世界現象,單靠實體書店的營收無法回本,必須從事複合式經營,結合其他商業活動,才能彌平書店虧損。我的回應是既然賣場與餐廳是主要獲利來源,既然媚俗的書店也不賺錢,掛名文創的松菸誠品選書何妨再小眾一點、再孤絕一點,給紛擾的心靈一個喘息的空間,也才不枉費文創頭銜。至於台灣大哥大的企業總部,要求其遷回原址又是一筆成本,務實的做法是其開放原總部大樓讓藝文創作者進駐,降低他們的租金負擔。在柯P市長磨刀霍霍揮向市府許多BOT案之際,我相信北市府一定可以對松菸經營者「道德勸說」,或者透過再議約方式,增加其增加藝文經營的比重,釋放更多的空間給非商業性的創作者。(全文)
(本文作者:本中心周韻采教授。中時電子報/2015-04-24
面對集體轉換成本,科技新舊不是其存活的影響因素
根據新聞報導,昨天有位知名作家發表一篇叫做「請跟PTT分手吧!」的文章,文中舉出其利用先表示現在科技如何確認其朋友在尼泊爾地震後的安全,並說明其應用的各項「新科技」,最後問台灣人「為什麼無論科技如何進步,最盛的還是科技層次跟整體美感都停留在56K撥接上網時代的BBS?」,並表示「BBS 盛行是台灣「特色」,其中又以「批踢踢實業坊」(PTT)最受 BBS 使用者喜愛。早已經被世界淘汰20年的BBS,重度使用者喜愛的一定不是其頁面的美感,流暢的設計,那麼是什麼?匿名的特性下,會不會是因為苦悶的台灣人覺得自己只有在這裡可以火力全開,噬血不用功的記者甚至也可以抄一抄不經查證就當新聞稿發?」,試圖利用批判性的文字,一方面表示BBS是一種落伍的技術,另一方面批判大家躲在匿名的保護傘下不敢負責,最後也批判到了現有的新聞工作生態,然後呼籲大家與「PTT分手」。

針對此位作家的三點批判中的第二、三點,網路上已經有各種解釋,筆者並不想多做說明,在此僅針對其第一個論點來討論,因為對於科技而言,並不是最新且好用的技術就一定會活下來,最典型的例子就是英文打字鍵盤。大家在學習英文打字時,應該都出現一個想法,就是各個英文字母在鍵盤上的位置,為什麼不按照字母順序而排列呢?現有鍵盤上的英文字母排列方式,從早期打字機的年代就流傳至今,那為什麼都沒有修正此種編排方式呢?原因很簡單,產業經濟學中的「集體轉換成本」正可說明為何我們依然使用1870年推出的打字機按鍵字母編排方式;所謂的集體轉換成本,是指一項技術具備著「好用程度隨著使用者人數的增加而增加」的特性時,一旦此一技術在市場上被使用的數目跨越關鍵多數,便會啟動正向循環,導致這項技術成為市場上絕大比例的人所使用;隨後,雖然市場上出現更新、更好的技術,但因為使用舊技術的人要轉換到新技術時,不僅要面對購買新技術產品與學習如何使用的成本,也要面臨使用新技術後與「舊技術使用者社群的技術」格格不入的情形,並進而影響了他未來的可能發展,這種因為使用者社群所形成的轉換成本,就稱之為「集體轉換成本」。

回到打字機的例子來看,現有鍵盤上英文字母的排列方式稱為QWERTY,在1870年代推出後,隨著打字機的普及而逐漸成為業界標準,因此熟悉每個字母位置便成為每位打字員都必須具備的技術;但因為其位置並沒有一字母順序而不好記,所以後續有人推出各項新的鍵盤,例如1932年便有Dvorak,在第一排的前面幾的位置都是放母音的字母,加快了打字的速度,而現在市面上也有依照字母順序而排列的鍵盤;這些新型字母排列方式的鍵盤,其實都大幅提升了使用者的打字效能,但卻都沒有辦法撼動QWERTY鍵盤在市場上超過165年的地位,就是因為打字員的集體轉換成本的影響,打字員如果使用新型的打字鍵盤,但新公司或是另一台打字機卻是QWERTY式的鍵盤,那其使用新鍵盤的打字技術就會失去其價值,因此在沒有人帶頭改用其它較新、較好用的鍵盤下,QWERTY繼續獨霸其市場地位。

類似的例子還有GOOGLE+社群網站的失敗,GOOGLE為了與臉書爭奪社群網站的地位,推出自己專屬的GOOGLE+,希望把臉書的使用者吸引過來,進而取代其在市場上的地位;為了降低使用者的轉換成本,GOOGLE+在使用介面的設計上相當容易,且與臉書上的各項功能沒有大差別,因此在推出時吸引了大量的註冊人數;但隨後使用者發現,當自己大部分的朋友還是以臉書作為訊息交流與傳播的平台時,去使用GOOGLE+便顯得多此一舉,且要增加額外的時間成本,因此在此一網站上的使用時間越來越少,最後就不去使用,讓GOOGLE宣告此一計畫失敗,而臉書依然獨霸社群媒體市場。

最後,回到PTT的議題上,PTT所使用的BBS技術,雖然已經是很舊的技術,其之所以成為台灣唯一存活下了的BBS站台,主要原因在於其使用者人數之多,在網路規模經濟的正向回饋下,其為所有訊息的交流中心,匿名性不過是其具備的特性,而使用者出此平台之外,便可能失去取得第一手資訊的可能性,並因此喪失與其它朋友共同討論的機會,顯見其集體轉換成本之大。因此,想要以新技術的美觀、好用來批評台灣人還落伍地使用BBS,那可能要先丟掉使用QWERTY鍵盤再說了。(全文)
(本文作者:本中心陳志成教授。自由時報/2015-04-29
媒體評論-讓懶人包退場吧!
去年太陽花學運的主訴求是反服貿黑箱,包括政府決策資訊未公開以及立法院缺乏監督機制等。政府之後一連串作為皆在回應資料釋出與開放決策過程,例如vTaiwan及公共政策網路參與平台。其實,因應《政府資訊公開法》於2005年底通過,各級機關早已公開資料。但問題是:一、非完整而全面性釋出資料;二、資料儲存的路徑詭異,一般人很難輕易地找到所需資訊;三、資料格式不利再使用,例如監察院公布的公職人員財產申報紀錄為圖檔,資料無法複製,逼得G0V動員婉君,逐筆手動鍵入,才能於網上公布立委的政治獻金。易言之,政府倡議開放資料,首先須將上述基本功做好。

然而,這3項基本功中又以第一項最難達成,完整而不加編輯地釋出所有資料,等於要求政府放棄言論市場的守門員角色,政府殊難利用資訊不對稱的優勢左右輿論。台北市政府說要把松菸文創合約上網供民眾檢視,這就是開放資料,然更重要的是,全面而完整地釋出所有市政府的BOT合約,才是透明施政,否則便是選擇性辦案。政府完整而全面地公開資訊,讓民眾擁有的資訊與政府相同,除了能達到透明治理外,更有政策說服的功能。

從這角度而言,服貿黑箱的癥點不在於沒有製作懶人包,以通俗易懂的語言廣為民眾周知,而在政府沒有釋出完整而全面的決策資料,阻卻了民眾可以以一己理性或群眾智慧理解政府施政的可能。我們可以大膽地說,懶人包是與開放資料的精神背道而馳的。懶人包是靠撰寫的人主觀地篩選資訊(即便他認為自己是客觀),再轉譯散播給婉君,這也是一種論述霸權,讓婉君們在資訊不對稱的情形下接受其觀點。

婉君們或謂我沒有時間閱讀,或者這些資料的陳述太艱澀了,惡意阻擋了我們參與的可能,所以要靠懶人包快速理解。但這就是政策的事實,現代社會各面向的交錯複雜性,已經沒有一分鐘可以懂又不會下錯誤結論的決策空間。非庶民語言的書寫的確形成了專業的傲慢,讓非專業的人難以參與討論。但簡化後的語言也同時簡化了議題的複雜性或忽略與其他議題交互影響性的探討。當所有資料都攤在眼下,若婉君們還只想用懶人包方式參與決策,對其他受影響的民眾豈非正義?

vTaiwan線上諮詢來看,雖然像閉鎖性股份有限公司或股權式群眾募資法制等議題的參與討論人數稀少,但參與者以學者的研究報告或主管機關預擬的法條為基礎深入討論,也適度地改變了主管機關的立場,將與會者的意見納入修正,正是開放資料良性的示範。基於開放資料的決策模式,應不須在乎參與的人數多寡,而在所有的利害關係方都擁有相同資訊充分討論,獲致符合社會公益的結論。

笛卡爾說我思故我在。知是民眾的權利,但完整開放資料後,民眾也要勇敢承擔決策思考的責任,不能再讓渡給懶人包了。婉君們,請讓懶人包退場吧!(全文)
(本文作者:本中心周韻采教授。中時電子報/2015-05-08
媒體評論-深刻觀點 超越速度
兩周前敝基金會發表立法院第八屆第六會期的績優立委名單,但傳統主流媒體完全沒有報導。參與發表的學者也告訴我們,報導立法院的新聞太硬,閱聽人沒興趣。然而,對照再兩天前另一民間團體公督盟公布了本會期缺席最多及完全沒有質詢的立委名單,卻獲得傳統主流媒體相當大篇幅的報導。我替這些舊媒體悲鳴,因為,它們已喪失了第四權的角色。

首先,傳統主流媒體歷經了狗仔熱、爆料狂及網路求快不求準的風潮後,也開始調整步伐,討好流行品味,取材角度只在乎有無爆點,形成隱善揚惡。下標也一定要做成「踢爆○○」才能刺激點閱率。故同樣是國會觀察結果的發布,傳統主流媒體一個完全不報,一個卻大作,只因前者是正面表列,後者是隱含獵巫式的負面表列。傳統主流媒體至此,已完全放棄了平衡報導的原則,更在主觀上剝奪了單一閱聽人資訊近用的權利。其次,傳統主流媒體這樣的篩選報導,更顯示其國會記者並不深刻了解國會運作,從而無法分辨國會評鑑指標建構的優劣性。熟悉國會運作的人都知道,立法委員出席率是個假評鑑指標,因為立委只要在開會時簽到就算出席,甚至有的狀況還允許補簽,簽完名就走的立委比比皆是。還有部分委員會可同時簽一天中的不同會議,形成立委來10分鐘就開了3場會的「超級出席王」。出席率指標造就了「上有政策下有對策」,變相鼓勵委員衝簽到而毋須出席開會的問政假象。遺憾的是,傳統主流媒體的記者與編輯們卻還大肆報導,只顯示了傳統主流媒體從業人員的素質並沒有顯著優於網路新媒體。傳統主流媒體在新媒體的襲擊下,自然顯得蒼白無力。

我參與的一項跨國數位匯流媒體的大調查顯示,台灣自2010年起投放在網路媒體的廣告量已超過紙媒;2013年後,非傳統電視(IPTVweb TV或行動電視)的收視人口也已高過無線及有線電視的總和。這些數據在在顯示舊媒體的榮景已一去不返了,即便奮力想要銳變成新媒體,但一切的模仿似乎還沒有回報。尚能慶幸的是,黑暗中的蒼白露出了幽微天光,可以指引舊媒體的方向。

現在仍位居舊媒體第一線奮戰的資深媒體人告訴我,在機器人都可以寫新聞的時代,傳統主流媒體能做的,不是比快、比辣,而是比深入、比觀點。我在台大教授「行政資訊管理」這門課時,利用國會資料告訴學生,選擇不同的評鑑指標就會有不同的評鑑結果,故沒有一個團體可以宣稱它的評鑑就是最正確的。學生問我,既然所有評鑑都不是絕對正確,那是不是表示我們不需要評鑑了?我說恰恰相反,縱使沒有絕對的正確客觀,但我們應可達到相對的客觀。在追求相對客觀性中,最重要的,就是不同觀點的相互激盪與辯證。閱聽人則可藉由審視不同觀點,滿足其深度知的需求。我相信,儘管身處在10倍速的時代裡,有些東西是超越速度的。深刻的觀點就是其一。傳統主流媒體,你的觀點在哪裡?(全文)
(本文作者:本中心周韻采教授。中時電子報/2015-05-22


大數據藍海

大數據於教育之運用:數據導向之學習分析與教育介入技術
圖六:數據導向之學習分析與教育介入技術示意圖
(Bienkowski, Feng, and Means, 2012)
學生的學習成效會受到許多因素的影響,例如學生的背景、個人特質、喜好、動機、學習行為、知識程度、教學方式等。然而收集和分析這些影響學生學習因素的數據費時費力,學生和老師難以取得即時的學習相關資訊來調整學習和教學。隨著學習資源管理系統和線上學習系統等電腦輔助學習系統逐漸被採用於學校和非正規教育,系統可以即時地收集和分析大量的學習相關數據,促使數據導向之學習分析與教育介入技術成為大數據於教育運用的研究重點。圖六是運用數據導向之學習分析與教育介入技術的模組與數據流示意圖(Bienkowski, Feng, and Means, 2012)。需要收集和分析的學習相關數據通常可分為學生個人資訊和學生學習數據。學生資訊包括學生的背景、個人特質、喜好、動機等數據。學生學習數據包括學生學習時的相關數據,例如教材瀏覽次數和時間、練習次數與時間、測驗表現、以及與老師和同學的學習互動。學者研發各種分類、關聯分析、和預測模型來分析相關數據,找出數據特定模式和趨勢,用來預測學生的學習行為和表現。預測模型所分析預測出的結果可以經由適性化機制提供學生適性化的學習內容與環境。預測模型所分析的結果也可以透過學習數據儀表板(learning dashboard)的視覺化呈現界面,協助學生和老師解讀數據並採取適當的行動。學生可以了解自身的學習狀況並調整學習方式,而教職員也可以針對個別學生或是群體學生作教育介入,輔導個別學生或調整教學。

數據導向之學習分析與教育介入技術已經開始被運用在實際教學情境。例如普渡大學的Course Signals系統收集與分析學生在每科目的修課表現、學習努力、先前的學習表現、以及學生特質,用來預測學生在每門科目的通過可能性(Arnold and Pistilli, 2012)Course Signals可以提醒學生留意有被當風險的科目,也提醒老師輔導有被當風險的學生。ASSISTment系統的學習數據儀表板顯示個別學生使用系統的學習時間、完成單元數、和答題正確率,以及全班學生在各單元的答題正確率,協助老師了解學生的學習狀況,以便調整教學和輔導個別學生(Feng and Heffernan, 2007)。可汗學院(Khan Academy)的學習數據儀表板提供21項視覺化的學習指標幫助個別學生了解自身學習狀況,也提供班級的群體指標幫助老師了解學生的學習狀況以便調整教學(Ruipérez-Valiente, Muñoz-Merino, Leony, and Kloos, 2015)

參考文獻
[1] Arnold, K. E. and Pistilli. M. D. (2012) Course signals at Purdue: using learning analytics to increase student success. In Proc. of the 2nd International Conference on Learning Analytics and Knowledge. ACM, pp. 262-270.
[2] Bienkowski, M., Feng, M. and Means, B. (2012). Enhancing teaching and learning through educational data mining and learning analytics: An issue brief. US Department of Education, Office of Educational Technology, pp. 1-57.
[3] Feng, M., & Heffernan, N. T. (2007). Towards live informing and automatic analyzing of student learning: Reporting in assistment system. Journal of Interactive Learning Research, 18(2), pp. 207-230.
[4] Ruipérez-Valiente, J. A. Muñoz-Merino, P. J. Leony, D. and Kloos, C. D. (2015). ALAS-KA: A learning analytics extension for better understanding the learning process in the Khan Academy platform, Computers in Human Behavior, 47, pp. 139-148.

 (本文由本中心周志岳教授提供)

大數據分析在醫療之應用
大數據(Big Data)時代來臨,隨著現今網路資訊傳遞快速與雲端技術的不斷演進,大數據已成為潮流的趨勢,一般人比較耳熟能詳的Facebook或者是Google的搜尋引擎,都是應用到大數據的方式建立其資料庫,這些被海量蒐集與傳遞的資訊大數據,為現今社會型態帶來日新月異的演進,想當然爾手中握有大數據的機構在世界上佔有舉足輕重的地位。

然而,除了日常生活所需要的資料,如今大數據也已被廣泛應用在醫療領域之中,大型的像是醫院與醫院間的醫療經驗分享,小型的如目前很受歡迎的ECG、血壓等生理監測穿戴式裝置,將一筆又一筆的數據傳到雲端中,進行遠端監測。這些醫療資訊將提供醫療機構,並且使醫療的技術精進,以及醫療品質的改善,同時這也代表著醫療與大數據結合其背後的無限商機。今年的華爾街日報對國際商業機器公司(IBM)砸了重金,與蘋果公司(Apple Inc.)、強生公司(Johnson & Johnson)等攜手併購醫療醫療軟體公司,企圖搶佔醫療大數據的龍頭[1]。台灣境內對於大數據與醫療結合還在起步的階段,雖然醫療監護還有許多App應用程式已在市面上流通,但缺乏充足的醫師或專業人員的判讀,甚至牽扯到資料保密性的法律問題[3]

反觀海外卻已經將此技術應用在醫療照護或系統的建立,韓國的Soon Chun Hyang University Hospital (SCHUH)將韓國境內包含首爾在內等不同地區的醫療紀錄、資料全部彙整到統一的大數據中心,並委託中心利用這些醫療資料建立出完善的醫療系統,不但減少醫生在診斷時所花費的時間,同時避免誤診的情形發生改善當地的醫療品質,其效益估計可以降低每年40%的醫療成本[2]

匹茲保大學醫療中心也利用大數據技術,對一些需要長期間監控的患者,24小時監測其生理狀況,病患訊息與大數據傳遞方式請見圖七,病患資料從圖七中右側開始,經過現有的監測裝置(下方)獲取病患生理資訊傳到左側的雲端中收集並整理,而大數據最重要的核心技術也是在這裡廣泛收集,交叉比對病患自身與其他相同案例,經過上方一連串的演算後,將所得到的結論最後回饋給所有的使用者[4,5]。當然對於一些有特殊過敏的病患,其資料會隨時告知醫護人員,減少過敏檢測所需要的時間與資源。此技術甚至還可以將腫瘤病患的長期資料做出一系列的演算,精確度高達95%去推估一些如病患腫瘤的位置。
圖七:病患數據與醫療系統結合示意圖(取自[4])
大數據與醫療的結合,已然勢在必行,甚至有可能完全改變現在的醫療結構,除此之外對醫療資源的運用與花費都有著相當正向的意義存在,雖說目前仍然許多需要克服的難題存在,但相信有朝一日,大數據這項技術會成為未來醫療的核心,隨著搭上大數據的波熱潮帶動醫療的快速進步,為人類醫療技術帶來曙光。

參考資料
[1]華爾街日報2015.04.14
[2] IBM官方網站(www.ibm.com/smarterplanet/us/en/ibmwatson/implement-watson.html)
[3] DigiTimes 電子時報2015.03.03
[4] Demirkan H., “A Smart Healthcare Systems Framework”, A Journal article published in IT Professional, IEEE Computer Society, Volume 15, Issue 5, Pages 38-45, 2013.
[5] McNeil C., “Smart Integrated Biodiagnostic Systems for Healthcare,” E-Health, Jan.2010.
(本文由本中心謝建興教授提供)