主題亮點

大數據視覺化分析與應用
Big Data Visualization: Analysis and Applications
隨著大數據時代來臨,巨量資料分析與應用之重要性與日俱增,未來將大幅度影響並改變人類生活型態。相關核心技術目前共面臨七項大挑戰,包含:容量(Volume)、速度(Velocity)、多樣性(Variety)、可變性(Variability)、真實性(Veracity)、視覺化(Visualization)、以及價值(Value)。其中數據視覺化便扮演著人類與電腦之間的溝通橋樑,不但能夠將大數據以各種圖形表示,還能夠以即時互動方式,來滿足使用者需要觀察從各種不同面向閱讀資料之需求,讓其更容易獲取所想要的資訊[1]。即時視覺化技術與工具更被認為是大數據分析能廣泛應用於實際問題的重要關鍵點之一,透過即時生成視覺化結果,能夠協助資料分析人員更有效率地探索巨量資料並消化吸收其分析結果。
有鑑於此,本團隊聚焦在兩個與視覺化相關之重大研究議題,包含:(一)巨量資料壓縮、分析與即時視覺化;(二)巨量資料視覺化與資料驅動決策,企圖提出嶄新的視覺化核心技術,同時發展具體實務應用,以創造大數據分析之附加價值。
巨量資料壓縮、分析與即時視覺化
近十年來,三維立體電影與電視之盛行,使得人類對於三維影像擬真程度之要求與日俱增,未來數年內支援虛擬、擴增、或混合實境之新穎裝置推出後,預期也將大幅增加擬真立體影像的需求量。為因應未來新興領域發展,本團隊妥善利用擷取自真實世界物體外觀之巨量資料,於電腦當中建構出三維光影現象與重現栩栩如生的物體外觀,同時研究如何能夠於合理執行時間內分析和壓縮所儲存之巨量資料,提供精確壓縮結果、高壓縮比、以及即時視覺化速率。整體系統流程如圖一所示,本團隊基於所提出之進階張量分析法進行巨量資料壓縮,並將壓縮結果應用於即時視覺化程序,以產生擬真三維立體影像,讓使用者能夠互動地觀看視覺化結果。
  :本團隊所提出之即時巨量資料視覺化系統流程圖

截至目前為止,本團隊共提出兩項新型態張量分析法,包含:
(一)、多重稀疏叢集張量分析(MK-CTA[2]。此方法能夠廣泛壓縮各種高維度視覺資料,提供逼近原始資料之三維立體影像,並輕易達到高壓縮比與即時視覺化速率。圖二顯示兩筆巨量資料運用此方法壓縮後,進行即時視覺化之結果,其每秒鐘之描繪速率皆超過30張畫面,平均誤差也都小於百分之四。
(二)、基於快取感知工作排程與繪圖處理器加速之張量分析[3]。此方法能夠將舊有相關方法之離線壓縮速度增加將近四至五倍(可由十數小時縮短為三小時以內),同時隨著資料量變大,壓縮速度增加之倍率也能維持一定水準。
:將本團隊所研發之新型態張量分析法,應用於即時視覺化程序之描繪結果
值得一提的是,本團隊所提出之張量分析法並非僅能夠處理視覺資料,也適用於其他型態資料,未來將可以進一步應用至跨領域研究議題,結合財務金融分析、人文社會科學、資訊管理科學、…、等等不同重大領域,進行各種型態巨量資料之分析以及處理。
巨量資料視覺化與資料驅動決策
運用表單資料來進行統計分析,一直以來都是能有效理解龐大資料變遷與趨勢的好方法,同時為了避免迷失於數字之海,透過多年來製表製圖的技術,使用者得以快速地從單調的數字中,一窺數字間隙中所潛藏的寶藏。然而隨著時代的變遷,資料收集管道日益複雜、多元化,異質資料的關聯分析與應用逐漸受到重視,針對龐雜、難以人工比對與閱讀之資料,傳統的報表與製圖技術漸漸難以滿足使用者之需求,因此基於使用者互動的新一代異質訊息視覺化議題便逐漸嶄露頭角。對於企業中的決策高層而言,來自資料中的訊息往往得以作為決策的最佳佐證。
成立於猶他州American Fork的新創公司Domo便是其中之佼佼者,在這個資訊產業之中,Domo扮演著中介的角色,透過異質數據收集、分析、視覺化來服務企業(圖三)。自2010年以來,該公司已經服務無數客戶,其中不乏eBay、等大型企業。Domo提供基於雲端的數據管理平台,企業可以透過該公司提供的服務查詢各種不同的數據來源,至今已經可以與數百家企業的資料來源進行連結[4],其商業智慧平台可以即時將多方來源提供之結構與非結構資訊整合分析,並採用互動式的視覺化方式呈現,除了協助管理人員決策,亦同時提供企業經營管理平台。
:企業主可使用Domo來回答各種商業決策相關的問題(圖片來源[5]
舉例來說,企業主對外可以利用這個平台來結合多平台所收集的資料,進而了解各種行銷管道,對於使用者的線上社群活動或是購物行為的影響。對內則可即時掌握各部門營業狀態、企業資金狀況等。目前Domo已有眾多企業客戶,包含DHLSage等知名企業都是Domo的合作夥伴。
本團隊與本中心之智慧零售團隊合作,著手開發針對百貨、賣場等企業之異質資料互動視覺化系統,擬基於銷售交易資料、行銷活動內容、周年慶DM組成、甚至是銷售櫃位地理關係等資訊,針對特定問題建置視覺化系統,藉以處理許多傳統報表難以有效回答的問題。比方說,分辨消費者是否閱讀DM,與其消費行為以及不同櫃位消費金額之間的關聯性,或是互動呈現不同大型餐廳與櫃位,對於整體百貨營收以及各分類櫃位營收間的差異。
:百貨櫃位營業額來源之視覺化範例(因資料之機敏性,櫃位名稱皆經過去識別化)
圖四為分析每個櫃位營業額來源之視覺化範例。透過DM關聯行銷活動以及巨量交易紀錄之資料,我們得以瞭解閱讀DM與否,是否會影響用戶的購買方向,並窺知兩種不同基礎狀態的消費者,對各櫃位消費量上分佈的差異。
:不同餐廳對於各個類別與櫃位的銷售影響力之視覺化範例
圖五則為不同大型餐廳,對於各個類別與櫃位的銷售影響力之視覺化範例。透過這樣的工具,客戶可以快速瞭解不同餐廳之間銷售分配的差異,藉此評估每個餐廳的行銷方案對於各櫃位潛在的銷售影響。
(a) 即時車輛狀態與位置視圖;(b) 基於目前車輛位置所做的車輛服務涵蓋熱力圖;(c) 基於車輛資訊所評估的城市交通狀況圖
除此之外,本團隊亦與本中心之智慧交通團隊合作,透過大量採樣計程車在桃園地區之載客行為,藉此進行多種不同的資料視覺化(圖六),以利計程車行快速瞭解目前整體車輛服務涵蓋狀況,並更進一步協助車行進行車輛調派等決策。大量的歷史資料同時也可以協助分析不同時段之交通路網與熱點狀況,或是觀察各個駕駛平常的載客服務範圍等地域性資訊。

參考資料
[1]H. V. Jagadish, Johannes Gehrke, Alexandros Labrinidis, Yannis Papakonstantinou, Jignesh M. Patel, Raghu Ramakrishnan, and Cyrus Shahabi. Big Data and Its Technical Challenges. Communications of the ACM, Vol. 57, No. 7, pp. 86-94, July 2014.
[2]Y-T. Tsai. Multiway K-Clustered Tensor Approximation: Toward High-Performance Photo-Realistic Data-Driven Rendering. ACM Transactions on Graphics, Vol. 34, No. 5, Article 157, October 2015.
[3]Y-T. Tsai, W.-J. Wang, and T.-Y. Kao. Cache-Aware Out-of-Core Tensor Approximation on GPUs. Technical Report, January 2016.
[4]A list of Domo Connectors: http://www.domo.com/connectors.
[5]J. Underwood. Investigating Secretive Domo, June 2014.
http://www.jenunderwood.com/2014/06/23/investigating-secretive-domo/.
(本文由本中心視覺化團隊提供)


虛擬攝影機技術的開發及其相關應用
Core technology development for virtual camera and its related applications
隨著隨著智慧型手機的普及,人們很習慣透過攝影鏡頭紀錄週遭生活的一切,但手機並不是只能用來拍照及錄影,藉由一些進階的攝影機定位技術,攝影機畫面可以有更多樣化的呈現。現今的技術可以在真實的畫面中加入虛擬物件營照出虛實相間的視覺體驗,此稱之為擴增實境(augmented reality),而我們稱這個可以拍到虛擬物件的攝影機為虛擬攝影機(virtual camera)。虛擬攝影機原本意指在虛擬環境中所設置的攝影機,不過藉由攝影機定位技術,我們可將真實世界與虛擬世界進行對位,此時我們手持的攝影機不但可以看到真實世界,也可看到虛擬世界的所有一切。

虛擬攝影機的應用非常多樣,例如在電影哈利波特中會動的海報,在真實的世界中並不存在,但透過我們的虛擬攝影機技術它可以如實呈現。以往的生存射擊遊戲只能在虛擬世界中進行,但如今如果透過擴增實境搭配虛擬攝影機技術,我們可以在真實環境中與虛擬人物進行對戰。其他如電影拍攝的場景,以往我們只能在電影拍攝完後到現場緬懷故事情節,但如今我們可以透過手邊的攝影機一起跟演員體驗電影的進行。其他還有非常多相類似的應用,只要想像力沒有界限,虛擬的世界就沒有極限,虛擬攝影機的應用就有多豐富。

在虛擬攝影機的應用中,最重要的關鍵技術在於如何取得攝影機當下的方向與位置,此稱為攝影機定位。有了攝影機的方位,才能將虛擬世界中的一切投影在畫面中,讓使用者觀看真實與虛擬結合後的結果。早期的攝影機定位技術是透過在場景中設置所謂的標記(marker),當攝影機拍到標記時即可藉由標記圖案的幾何關係定位出攝影機相對於標記的位置,但此舉顯然在應用上有諸多的限制。目前最新的攝影機定位技術可以直接利用場景中的自然特徵進行攝影機方位的估算,例如圖七左圖所示為元智大學七館的照片,如果我們已事先計算出元智大學七館中某些特徵點的三度空間位置如圖七右圖所示,則藉由影像中的特徵點與三度空間特徵點的對應關系,我們即可算出當下攝影機的方位如圖七右圖下方的紅色角錐體。以往這方面的研究大都著眼於小區域如室內的場景進行攝影機的定位,近幾年來開始有學者進行戶外大型場域的攝影機定位研究。本研究團隊目前也正在進行此方面的系統開發,我們先以元智大學校園做為攝影機定位的研究場域,為此我們必須取得元智大學校園的三度空間資訊,圖八所示則為我們建立的幾個場景的三維點雲。當三維點雲建立完畢後,針對給定的一張查詢影像,系統必須快速找到相類似的影像以便進行細部的影像特徵點匹配,如此才能決定查詢影像的攝影機方位,因此影像的檢索在本研究中是必要的一環。以往的研究有些是利用手機的GPS資訊來篩選檢索的影像,然而GPS取得的位置有相當的誤差,因此經過篩選後仍可能留存大量的影像,故本研究擬以全影像的方式進行影像檢索,我們採用目前在影像檢索領域中效能評比最佳的深度學習網路CNN[1]進行影像檢索,之後再將檢索後的影像與查詢影像進行特徵點的匹配,最後再以PnP (Perspective n Point)演算法計算出攝影機當下的方位。

在前述的攝影機定位研究中,場景的三維重建是非常重要的一環,而此牽涉到影像中的特徵點匹配問題。目前常用的影像特徵點有SIFTSURF等,這些特徵點的偵測及比對技術對於低解析度少量的影像而言不會是問題,但以目前動輒百萬或千萬畫素的高解析度影像而言,影像上可以偵測到數千甚至上萬個特徵點,而如果比對的影像數量又多的話,則特徵點匹配的效率將會是實際應用上的瓶頸。雖然目前已有一些加速的方法如ANN (Approximate Nearest Neighbors)[2]等以及更快的影像特徵點偵測技術,但在可見的未來,影像解析度及影像資料量必會持續攀升並超過前述方法的負荷,因此如何提升影像特徵點匹配的處理速度將會是一個重要的研究課題。

有鑑於此問題的重要性,本研究團隊以目前已知有非常良好匹配效率的cascade hashing演算法[3]為基礎,針對其改進並希望能提升其匹配的效率及準確度,為此我們提出了一個漸進式的hashing based影像匹配技術,此技術利用投影幾何學中的epipolar geometry進行特徵點的過濾,利用持續增加的影像對應點更新epipolar geometry及其不準確度的估算,以此逐步限縮特徵點比對的範圍。與傳統應用epipolar geometry方法不同的地方在於我們不要求非常精準的epipolar geometry估算,而是藉由犧牲一些過濾的點數來換取系統整體的運算效率,同時我們也擬引入一些影像特徵點分群的策略來提升特徵點過濾的效率。目前這方面的研究仍在持續進行中,圖九則為此方法的初步結果,圖九左圖中的紅色圓圈代表欲進行比對的特徵點位置,圖九右圖的紅色及綠色圓圈代表經過cascade hashing之後所得到的候選點,圖中綠線代表epipolar geometry所限縮的範圍,正確的對應點應落在此範圍內。圖九右圖的綠色圓圈則為經過epipolar geometry過濾後剩下的點,從圖中可看出利用epipolar geometry確實可過濾大量不正確的影像特徵點(紅色圓圈的點)。此技術未來應可應用於大量的影像匹配,對於大數據影像及視訊分析應有相當的助益。

前述研究純粹是以影像進行攝影機的定位,但目前的行動裝置上都配備陀螺儀及三軸加速器,這些設備亦可用來輔助進行攝影機的定位,因此本研究團隊目前也正在進行以慣性設備(陀螺儀及三軸加速器)為基礎的攝影機定位研究。我們以機器人領域常用的定位技術Extended Kalman Filter (EKF)進行相關的研究。在EKF中需要維護一個系統狀態,而此系統狀態包含裝置的位置、速度、方向以及三度空間中一些特徵點的座標,研究發現特徵點座標參數化表示法對於系統的穩定度及準確度都有一定的影響。目前常用的參數化表示法為inverse-distance point (IDP),此方法會在攝影機第一次觀察到特徵點時,以當下攝影機的位置(稱為錨點anchor point)對此特徵點進行參數化,然而我們發現參數化的時機點對於系統的效能也會有影響,因此本研究團隊提出了一個重新參數化的方法,藉由選定適當的錨點,應可得到更好的效能表現。圖十則是特徵點重新參數化的示意圖,當攝影機移動到一個更佳的觀測點時,此時更新錨點的位置並對其參數進行重新的定義應可達到更佳的效果。

圖七:元智大學七館的照片(左圖)及攝影機定位的結果(右圖)

圖八:元智大學校園場景的三維點雲重建

圖九:利用epipolar geometry過濾影像特徵點

圖十:特徵點的重新參數化示意圖

參考資料
[1]A. Krizhevsky, I. Sutskever, and G. E. Hinton, "ImageNet classification with deep convolutional neural networks," Advances in Neural Information Processing Systems, NIPS 2012.
[2]M. Muja and D. G. Lowe, “Fast approximate nearest neighbors with automatic algorithm configuration,” in VISAPP International Conference on Computer Vision Theory and Applications, pp. 331-340, 2009.
[3]J. Chen, C. Leng, J. Wu, and H. Lu, “Fast and accurate image matching with cascade hashing for 3D reconstruction, “ in Proceedings of 2014 International Conference on Computer Vision and Pattern Recognition, CVPR 2014.

(本文由本中心鄧進宏教授提供)

匯流政策時論

媒體評論-沒有絕對中立的媒體
上個月馬習會引起媒體及輿論高度關注,學者黃丞儀於《獨立評論 @天下》發表了一篇馬總統應被彈劾的評論,隨即被下架,除引起作者抗議外,更引起其他評論者的響應一起退出作者群。後續討論並在網路公知圈內燃燒了好一陣子。雖然主流媒體並未大肆報導此事,筆者沉吟許久,仍覺有探討必要。

首先,《獨立評論》將已上架文章又下架的作法,相當粗魯,不合乎一般網路言論平台操作原則,無怪乎作者群群情激憤。然而,這些作者主張,下架行為形同思想檢查,同時扼殺了獨立及多元言論的空間,這是言論市場不允許的。我以為言論平台的所有權人可否審查作者文章,應屬雙方合意範圍。若《獨立評論》未事先告知保留刊登及改稿的權利或表明絕不干涉,那麼作者的憤怒是有道理的。反之,則是作者藉獨立之名將「作者論」無限膨脹。言論市場的多元應是指各種言論都有相屬的平台發聲不被壓抑,而非限定某一特定的言論平台(除公視外)必須涵納所有言論。美國各大媒體很清楚地向閱聽人展示自己色彩,並沒有哪一家特別以多元中立為標榜,也沒有被要求須涵蓋各式甚或相衝突的言論。就此而言,《獨立評論》當然可以只刊載與其所有權人意識形態相符的言論,只是這樣的選擇說明了《獨立評論》過去吃了獨立這一語詞好大的豆腐。

說到底,下架事件反映了傳統媒體進入新媒體卻適應不良的病症。當《天下》轉向網路發展時,觀察到年輕人是網路重度使用者的趨勢,傾向年輕世代的觀點自然容易造就網路流量。然紙本《天下》所彰顯的觀點跟網路主流意見是有相當大的差異甚或矛盾的,故其推出副品牌時,刻意加入主要網路人口贊同的公知分子,以形塑新媒體的形象,吸引網路流量。然台灣的世代分歧越來越嚴重,尤其在對馬習會的觀感上徹底決裂,也造成《獨立評論》與公知分子終須一別。

《獨立評論》的悲劇經驗是否證明了傳統媒體已無望突破新媒體天險?我並不悲觀。其一,《天下》本體的意識形態仍有受眾,只不過不是網路主流。當類《天下》媒體轉進新媒體時,更值得思考的問題是需不需要媚俗於網路主流意見。即使是網路世界的小眾,即便他們創造的流量有限,仍然有發聲的需求,且他們相對網路主流人口對符合其品味的言論黏度更高。其二,長遠來看,現在的網路小眾十餘年退休後反轉成重度黏著者,而現在的年輕世代未來要養家活口,沒時間黏網,網路主流意見屆時也會江河日變,這也是傳統媒體發展新媒體時應警惕之處。

某些新媒體以獨立、開放、多元、公民等語彙標榜自己,然它們散布的言論每每套在特定情境中,越來越像喬治歐威爾《1984》中的真理報。所以當傳統媒體轉進新媒體時,如何能抗拒追逐網路流量這般浮士德的誘惑,才是生存制勝之道。(全文)
( 本文作者:本中心周韻采教授。中時電子報/2015-12-04 )
大數據預測 為了防患未然
在社群媒體蓬勃的今天,政府施政若未能及時澄清網路謠言,就容易醜化主政者的施政形象,從而影響政務的推行,大專畢業生「22K」低薪資的誤傳就是具體案例。主政者面對這種以訛傳訛的網路謠傳,最好的終結辦法就是「讓證據說話」。
行政院首度公布「大專校院畢業生就業薪資」大數據分析結果,以九十九學年度大學畢業生來看,平均起薪為25K,而非社會上瘋傳的22K。工作三年半後平均月薪為33K,薪資約成長三成,顯示大學生薪資比外界常稱的22K高。

事實上,西方國家主政者面對金融大海嘯、國際恐怖主義以及全球氣候變遷的威脅,必須編列龐大的施政經費,為了爭取民心與國會的支持,必須提出證據導向的政策方案,否則就連國會大門也難以通過,大數據分析遂成為必備的政策分析工具。張善政副院長努力推行的大數據分析,乃是毛揆射出的「科技三箭」之一,將它應用到教育政策爭議的釐清上,可謂適得其所,值得我們肯定。

然而,與其等待大數據分析結果去澄清誤解,還不如在政策規畫之前,就做好與利害關係人的充分溝通與宣導。以22K計畫而言,這原本是教育部為了提升大專生進入職場競爭力的良好計畫,其目的是希望透過教育部的經費補助,讓準備進入職場學生的履歷表更受到企業雇主的青睞,故以一位實習生的月薪而言,22K薪水不能說太低,何以竟然演變為政府拉低大學畢業生就業薪資的「元兇」?
這應是教育部承辦單位始料未及之事,而主辦單位對於政策實施之後,輕忽了大學生在網路留言版的質疑與批判聲浪,一旦誤解言論淪為社群媒體的「慣常用語」,就很難加以匡正。22K如今成為教育部不可承受之重的指責,應以此為鑑,好好學習如何正確地掌握社群媒體的輿情反映、如何研擬及時的危機溝通對策,以免讓錯誤的政策謠言,像細菌一樣傳遍每個角落而束手無策。

平心而論,運用大數據分析固然發現25K事實,澄清了行之已久的坊間誤會,但畢竟都是「成之於已然」的「事後諸葛」,政府應該透過大數據分析技術加強「防患於未然」的政策預測與規畫能力。如十年後我們到底需要多少的大學與大學生?
目前教育部正苦於收拾大學過多的爛攤子,大數據分析能夠為我們提出可靠的預測數據嗎?請大家深思。(全文)
( 本文作者:本中心丘昌泰教授。聯合新聞網/2015-12-19 )

台灣能打造「網速強國」嗎
在第二場電視辯論會中,網民提出了值得注意的網路政策問題,三位候選人都做出具體承諾,誓言要縮短數位差距,打造數位科技產業。在今天雲端科技蓬勃的行動通訊時代,的確改寫「國家競爭力」的定義,過去強調的人多、地大、物博,如今看來並非完全正確。根據美國雲端服務供應商Akamai對全球網際網路速度的評比,平均網路連線速度仍以南韓居首,緊接在後的是瑞典、挪威,鄰近的香港排第5、日本排第7,台灣則排列全球第33名。前五名都屬於「小國寡民」,可見沒有網速,台灣就沒有競爭力。

台灣主管通訊網路業務的政府機關是通訊傳播委員會(NCC),目前正如火如荼將3G提升到4G速度,但鄰近韓國卻堂而皇之的宣布:正式邁入5G時代,並打算砸下440億台幣,快速發展5G系統,傳輸速度比4G快上1千倍,下載一部800MB電影,只要一秒鐘,最快2017年上路。當總統候選人喊出未來應該要發展物聯網、大數據、工業4.0、金融3.0等,殊不知前提條件是台灣社會要有5G 通訊基礎設施,否則一切將流於空談。

網路建設何以無法「超韓趕港」?原因很多,一言以蔽之,通訊產業涉及龐大的商業利益,不同立委代表不同的業界壓力,加上藍綠惡鬥,造成意見對立不易妥協,以至於立法速度緩慢,例如攸關台灣數位產業發展的「數位匯流五法」,馬政府任內確定無法過關,下任政府將繼續孵蛋,何時通過無人能掛保證。

當通訊業者依法架設基地台時,無論架到哪裡,都有居民或政府機關以嚴正抗議,儘管世界健康組織(WHO)已經提出報告,並無具體證據顯示基地台地磁波對人體有身體健康上的影響。

提高網路速度的目的不只是讓網民有飆速快感,政府還要想辦法與青年人所能著力的科技產業做有效連結,可惜三位候選人都未能點出來;只是蒐集網路資料,隨口喊喊時下流行的產業名詞,完全沒有切入這些產業的戰略布局構想。文化創意產業是台灣未來的新興產業,也是頗受到年輕人嚮往的產業,建議政府應大力發展OTT產業,如微電影、紀錄片、唱歌、動畫、短劇等,在這次辯論會中沒有任何一位候選人重視這些主張,包括號稱最了解年輕人的蔡英文主席也是一樣。(全文)
( 本文作者:本中心丘昌泰教授。蘋果日報/2015-01-04 )


大數據藍海

雲端媒體之安全應用
自動目前最被大眾所知悉的雲端服務就屬雲端儲存 (cloud storage) 莫屬了,Cloud storageDropbox所提供的服務就是提供使用者儲存空間讓使用者能夠備份上傳他們的資料,並且進行雲端與使用者所持有的不同裝置做資料同步。由於儲存空間的免費特性,使用者往往都會註冊多個Dropbox的帳號,以多獲取免費儲存空間 (free space),如此便加重雲端儲存營運者的儲存成本。目前雲端儲存管理 (cloud storage administrator) 最常用來降低儲存成本 (storage cost) 的方法,即為資料去重複技術 (data deduplication)。從2010年開始有研究指出,具有data deduplication尤其是cross-user client-side data deduplicationcloud storage,雖然可以獲得storagebandwidth saving,但是也多了安全與隱私上的顧慮。譬如,圖一的四個case即是上述安全與隱私上的顧慮。圖十一(a)代表惡意使用者可以探知別人檔案存在與否,圖十一(b)代表雲端儲存會變成秘密通道讓人傳送惡意訊息,圖十一(c)代表雲端儲存會變成非法的CDN,圖十一(d)代表雲端儲存會讓人惡意下載檔案。

圖十一:雲端儲存的各項攻擊
2014 Symantec ISTR (Internet Security Threat Report) 指出,2012年至2014年間資安事件由156件增加到312件,三年成長了足足一倍,總洩漏資料量由9.3千萬筆增加到3.48億筆。例如:2013Sony事件造成1.01億筆資料外洩;2014Home Depot事件造成5600萬筆資料外洩。這些資料外洩的事件經媒體報導,使得資料外洩企業所遭受有形及無形的損失難以估計。以企業市場異常報酬說明資料洩漏事件對企業的重大影響,2011Sony 所發生的PlayStationy網路線上遊戲社群資料庫7000 萬用戶資料遭竊用戶個資外洩為例說明。從圖十二可看出,420日資料外洩消息披露後,日本的股票市場即時反應,重挫10%。之後股價一直下滑,至522日股價下挫12%,而同一時期的日經指數則是平盤以上。兩相比較可以看出Sony 的股價下挫與大盤無關,而是受個資外洩事件的影響。在近一個多月的時間裏,Sony的市場價值因此資訊安全事件損失就達36億。

圖十二:Sony 20113-5月股價走勢
由上述了解資訊安全對企業發展極為重要。此外,由於行動裝置設備 (如智慧型手機、平版電腦、攝錄影機) 已成為最廣泛使用的拍照設備,媒體在社群分享與網路傳輸是必然的應用趨勢,但分享的媒體容易遭受盜用及非法下載。保護媒體所有權及共享機密訊息,是目前行動裝置在拍照與社群共享時,相當重要的保護需求,然而現階段的行動裝置,卻相當缺乏有效的即時媒體保護應用技術。本團隊開發可應用至行動裝置所拍攝的照片及影片,即時將重要資訊(如所有權或機密資訊)隱藏嵌入拍攝的照片或影片內。一般使用者瀏覽時,媒體外觀是正常的,看不出有任何異狀,故媒體可在網路間隨意進行分享及社群應用。唯有合法接收者,經由行動裝置的圖形處理,隱藏的可視機密資訊將直接顯示於影像上,提供使用者在裝置媒體的可視資訊宣示,如圖十三所示。

 圖十三:行動裝置之機密保護應用
參考文獻:
[1] Yu Lin and Wei-Fan Hsieh, "Media Pattern Exhibition Mechanism via Mobile Devices," Journal of Visual Communication and Image Representation, vol. 25, no. 8, pp. 1856-1864, 2014.
[2] 2015年台北國際發明暨技術交易展
 (本文由本中心游家牧、張國忠與林珮瑜教授提供)
物聯網與大數據時代下的個人化精準醫療
2014年,當致力於電子病歷(Electronic Medical Record, EMR)分析,藉以尋找癌症機轉與治療方法的大數據公司Flatiron Health獲得Google創投(Google Ventures)高達1.3億美元投資後[1],個人化精準醫療(personalized medicine)隨即成為火紅的熱門主題,這樣一股氣勢發展,讓美國總統歐巴馬(Obama)更在今年提出精準醫療計劃(Precision Medicine Initiative),並投入2016年預算高達2.15億美金之譜[2]
在精準醫療這般的強勢展開下,不僅僅只有過去生物資訊上基因體學、轉錄體學上的資料探勘或是電子病歷醫療健康數據分析,物聯網(Internet of Thing)的發展也同時透過行動裝置與消費型穿戴式裝置大舉進入個人化健康促進與醫學上疾病研究領域。在這機電感測裝置快速發展下,各種輕巧卻具備多種感測裝置的隨身穿戴式裝置逐漸普及於消費電子商品市場,各家廠商發展出豐富的產品功能不僅能記錄活動頻率,更能偵測活動強度、睡眠狀態、作息規律,更甚至能取得穿戴者24小時的心跳狀態與壓力疲勞狀態,並利用這些生理數據進行健康促進的提醒與建議。

然而向來以創新設計為圭臬的蘋果公司,在這一波趨勢的發展下當然不會缺席,除了在2015年然而向來以創新設計為圭臬的蘋果公司,在這一波趨勢的發展下當然不會缺席,除了在2015年正式上市首款穿戴式裝置『Apple Watch』智慧手錶外,更針對醫學健康研究,大舉開放iPhone應用程序接口(Application Programming Interface, API),推出開放源碼的軟體架構ResearchKit[3,4],透過ResearchKit,研究人員與軟體開發人員得以在iOS系統中快速開發App並且直接存取iPhone具備的各項感測器。ResearchKit的精神,在於透過iPhone的普及進行大量自願者的招募參與研究實驗,藉由更多人的個人化健康、醫療大數據蒐集,進行規模更大更多元的研究。 
圖十四:知情同意書個人簽章功能
ResearchKit的功能主要分為三大類別[5],問卷調查(Surveys)、知情同意書(Consent)與活動測驗(Active Tasks)模組,研究人員可以透過問卷調查模組快速設計研究問卷並且藉由App發布與統計記錄,而知情同意書模組更貼心的讓研究人員能自訂研究知情同意條文並提供志願者進行數位簽名以確保研究的進行符合人體實驗規範的要求。此外活動測驗(Active Tasks)模組更是研究人員極佳的調查工具,透過iPhone的內建功能,便可以透過iPhone 5, iPhone 5s, iPhone 6, iPhone 6 PlusiPod touch每天甚至每小時頻繁、規律地採集數據,記錄人們的日常作息與生活變化,並且搭配內建的GPS、加速感應器、氣壓計與陀螺儀等先進感應器甚至是Apple Watch,可以更客觀、正確與精準的將數據量化並且傳送至ResearchKit app,這是過去醫療保健、公共衛生研究人員從未有過取得如此鉅量量化數據的機會[6]

Table 1. ResearchKit活動測驗模組
透過與ResearchKit共同合作的研究發佈,可以看到各種醫學研究的創意,如西奈山伊坎醫學院(Icahn School of Medicine at Mount Sinai)與康乃爾大學威爾醫學院(Weill Cornell Medical College)推出的Asthma Health[7,8],透過iPhone裝置記錄個人位置、個人每日活動與志願者記錄每日氣喘觸發原因,並提供地區氣溫與空氣汙染資訊以及衛教資訊供志願者進行參考。此外約翰霍普金斯大學(Johns Hopkins University)則透過ResearchKit整合iPhoneApple Watch所獲得的資訊,開發出應用App: EpiWatch[9],針對罹患癲癇疾病的志願者進行生理數據偵測,記錄志願者於癲癇發作時的生理、心跳數據,藉以做為未來癲癇發作的預警與預防。此外羅徹斯特大學(University of Rochester) 則是與 Sage Bionetworks 共同合作,透過ResearchKit開發出 mPower app[10],量測志願者的靈活性、平衡性、記憶力與步伐等,藉以了解個人的生理資訊變化與帕金森氏症之間的關聯。

個人化精準醫療,這個過去無數研究學者憧憬期盼卻遙不可及的夢想,在現今儀器設備、網路通訊與大數據分析處理技術大躍進的時代裡,已經逐漸成為可以實現的目標,相信不久的未來也終將普及於健康促進與醫療模式中。
參考文獻:
[1].Flatiron Health Raises $130 Million Series B Round Led by Google Ventures and Agrees to Acquire Leading Cloud-Based EMR Company Altos Solutions(2014-05-07): http://www.flatiron.com/press/seriesB
[2].The Precision Medicine Initiative (2015): https://www.whitehouse.gov/precision-medicine
[3].Apple ResearchKit: http://www.apple.com/researchkit/
[4].ResearchKit open source framework: http://researchkit.org/
[5].ResearchKit Framework Programming Guide:  http://researchkit.org/docs/docs/Overview/GuideOverview.html
[6].Apple ResearchKit launches in the UK: Here's everything you need to know (2015-08-06): http://www.pocket-lint.com/news/133132-apple-researchkit-launches-in-the-uk-here-s-everything-you-need-to-know
[7].Asthma Mobile Health Study: http://apps.icahn.mssm.edu/asthma/
[8].More than 75,000 People have Enrolled in Health Studies using Apple's HealthKit (2015-07-28): http://www.patentlyapple.com/patently-apple/2015/07/more-than-75000-people-have-enrolled-in-health-studies-using-apples-healthkit.html
[9].Apple Brings to Light that new Research Studies have begun for Epilepsy, Autism & Melanoma using ResearchKit (2015-10-15): http://www.patentlyapple.com/patently-apple/2015/10/apple-brings-to-light-that-new-research-studies-have-begun-for-epilepsy-autism-melanoma-using-researchkit.html
[10].mPower: Mobile Parkinson Disease Study (2015): http://parkinsonmpower.org/

(本文由本中心潘人豪提供)

大數據報報

電信業者發展OTT等服務以維持利潤
歐洲議會決議2017年起取消歐盟會員國境內行動通信漫遊費,根據英國The Telegraph研究報告指出,這項決議會讓行動通訊業者的收益下降2%。為避免成為笨水管,電信業者無不設法提出新興服務以維持利潤。在App store紛紛獨立出電信業者之外時,發展行動支付和影音串流服務成為電信業者的新課題。【Light Reading/2015-12-02全文
直播環法自由車賽 未來新媒體趨勢
2015年環法自由車賽利用運動攝影機GoRro將賽式內容即時上傳至機上盒等,形成新媒體服務。透過即時動態資料關聯處理,按全球賽事討論情況彙整出觀眾最關心的資訊並自行車上安裝的GPS追蹤器和GoPro、選手配戴生理感測裝置所記錄的選手資料然後上傳至資料中心處理,觀眾還能使用串流App觀看直播賽況,無不道盡新媒體未來趨勢。【Dimension Data/2015-12-04全文/全文
Hadoop近期變革之HDFS4大發展方向
日本Hortonworks專家蔣燚峰表示近年來HDFS的進化聚焦於企業功能上,包括NamenodeHA高可用性架構、檔案系統快照、HDFSNFS串接閘道,以及資料加密機制等四大面向,Hortonworks目前推出的產品HDP,是唯一同時支持LinuxWindowsHadoop產品,最後也表示採用百分之百的開源Hadoop版本。【iThome/2015-12-06全文
Apple將暫緩Apple TV 線上影音服務
Apple 將暫緩自家Apple TV的線上影音串流服務,而轉型為平台服務。Apple原先規劃提供14個頻道,以3040美元的月費向消費者提供服務,然而內容業者認為授權金額過低,無法達成協議。據悉Apple將放棄獨力推出線上影音服務,而改採App store的模式,讓內容業者自行上架販售影音內容。【Bloomberg/2015-12-09全文
聖誕節檔期全球52%用戶訂閱OTT TV
歷年來節慶檔期的OTT用戶數都有顯著成長,根據英國 Paywizard研究,聖誕節檔期全球有52%的用戶訂閱OTT TV,且其中27%是新訂戶,然而有15%的訂閱戶預計在一月退訂,有30%的用戶預計在6個月內退訂。【BUSINESS WIRE/2015-12-09全文
傳美國Verizon將買下Yahoo客戶數據
據報導,其中Verizon Communications對於yahoo考慮出售互聯網業務相當感興趣,收購yahoo互聯網資產將有益於推動日益增長的廣告技術業務,先前Verizon斥資44億美元收購AOL,未來,Verizon將整合AOL以及yahoo數據,預期將成為GoogleFacebook的對手,助於提供更好的廣告,且在不同的地方提供對的廣告。【CIO/2015-12-09全文
美國Verizon將推出Sponsored Data服務
美國電信業者Verizon將於2016年推出Sponsored Data服務。Sponsored Data服務是指消費者觀看特定內容或使用特定服務時,由該服務商支付消費者的數據傳輸費用,而不計入消費者的用量中。AT&T2014年初即宣布將提出類似服務,但截至目前仍在測試中。反對者則認為這有侵害網路中立性的疑慮。【Re/code/2015-12-09全文
看準OTT TV商機 Yahoo推出跨平台OTT TV內容搜尋服務
Yahoo推出智慧型手機app Yahoo Video Guide,讓用戶可以跨平台搜尋影片。多數OTT TV訂戶訂閱一個以上的OTT TV,以致時常搞不清楚某個影集是在哪個平台播出。Yahoo Video Guide則讓訂戶不必再於多個app間切換搜尋,只要於Yahoo's app中搜尋影片,點擊後即會自動於HBO GoHulu中播放。該app目前支援30個以上的OTT TV平台搜尋。【TRENDING/2015-12-14全文
NCC公布「電信事業法草案」及「電信基礎設施與資源管理法草案」
NCC公布「匯流五法」中最後兩個草案:「電信事業法草案」及「電信基礎設施與資源管理法草案」。NCC表示此二草案乃參考先進國家層級管制模式,打破舊電信法以語音服務為中心的管制架構,以「市場參進自由化」和「重點資源管理精準化」為核心,希冀創建健全的公平競爭環境。【NCC/2015-12-14全文
ITU成員 大數據國際標準達成一致
20151218日,日內瓦ITU國際電聯成員批准第一份有關大數據的國際電聯標準,內容詳細規定以雲為基礎的大數據的要求、能力和使用案例以及高級“系統背景”方面的考慮及其與其他實體的關係,其大數據範例也提供了一個有效、可擴展的解決方案。【International Telecommunication Union /2015-12-18全文
廣電三法修正案通過 排除爭議條款
廣電三法修正案今日(18)於立法院通過三讀,法案中明訂了節目廣告化裁罰標準,並規定新聞節目和兒童節目不得置入性行銷。然而修正暗中較具爭議的「黨政軍條款」、「無線頻道必載」、「分組付費」則遭到擱置,並未通過。【聯合新聞網/2015-12-18全文
如何利用大數據幫助一家企業
企業蒐集數據,但如何應用這些蒐集來的數據並幫助企業獲得更高的利潤,下面有幾點要注意,分別是要領先於競爭對手去了解客戶喜好、投入金錢和時間去研究並分析數據,找出有利於企業的訊息、培訓公司員工、發揮創意利用數據且不要害怕顛覆傳統思維。【SmartData Collective/大數聚 Big Data Group/2015-12-18全文
大數據讓聖誕老人知道該怎麼送禮物
透過大數據,聖誕老人(零售商)能夠有智慧的管理庫存,確保全國各地商店擺放這對的商品、對的數量,那這些可以藉著大數據進而分析,如氣候條件、購買模式、市場條件或是趨勢等等,另外,大數據除了有效管理庫存,也能顯著改善物流配送系統,Wine.com就是實例,利用數據使訂單成長了15%。【Tech.Co/2015-12-22全文
因應趨勢 日本企業廣設大數據部門
日本有越來越多企業成立大數據部門分析公司內部資料,用以降低生產成本、提供產量、品質等,根據統計有67%的企業利用大數據分析改善營運模式,並因此提升14%的效能,另外,人工智慧能提高數據使用效率,近90%公司表示未來將導入人工智慧。【Nikkei Asian Review/2015-12-24全文
2015前瞻趨勢國際論壇
此論壇以「大數據x聯網生態圈」為主軸,資策會大數據所、IBMD-Link、國立交通大學,四方共同簽署「極量數據智慧互聯網策略聯盟備忘錄」,此協議將推動策略聯盟進一步強化在巨量資料時代的定位,未來將以協助企業轉型升級為導向。【中時電子報/2015-12-24全文
大數據正改變經商模式
銀行和零售商最早利用大數據,緊接著才是其他產業,大數據之所以有用,絕非只是因為規模大,更是因為資料的即時性和高頻率以讓決策者可以即時執行商業策略,簡單來說,使用大數據可以優化營運模式、更快速的反應、改善服務品質、更聚焦於客戶溝通。【THE TIMES OF INDIA/2016-1-2全文
FCC公布第五版美國寬頻網路報告指出寬頻網速成長了3
美國聯邦通訊委員會FCC公布了第五版美國寬頻網路報告,指出美國境內網路平均下載速度從2011年的10Mbps 提升至2014年的31Mbps,足足提升了三倍。為突破美國網路速度落後的窘境,FCC變更原先只需4Mbps即可稱為寬頻網路的規範,調升至10Mbps,並進一步帶動網路速度成長。【PCworld/2016-01-02全文
Netflix下一步將進軍印度
已在台灣正式推出OTT TV服務的Netflix,正積極拓展亞洲市場。除了日、韓和台灣外,據傳下一步將進軍印度市場。對此印度的數位影音平台皆成備戰狀態,希望能迎進Netflix於自家平台。但也有分析師不看好Netflix的進駐,認為影視內容需要在地化才能夠吸引消費者。【Business Standard/2016-01-04全文
Netflix服務在台正式推出 月費270元起
美國知名OTT TV服務商Netflix正式在台推出服務,月費270元起即可享用隨選視訊服務。Netflix於今年CES展中宣布將於130個國家推出服務,而台灣於201617日服務正式推出,若選擇最高資費方案390元,則可同時於4個螢幕上觀看影片,並享用超高畫質服務。但和其他國家相比,日本最低資費僅需5.4美元,美國最高資費也只要10.99美元,台灣訂價相對高出許多。【數位時代/2016-01-07全文
百度首推大數據量化基金
百度即將與國金證券共同推出國內首支大數據量化基金,主要是從互聯網中撈資將在投資模型中納入「人」的因素,透過百度龐大的用戶資料,精準辨識出網民金融意圖、股民情緒以及預測產業走向,這將會是創新的投資模式。【China Money Network/2016-01-04全文