Google Analytic

2016年8月18日 星期四

[TED] 幾個TED演講重點整理(3)List on several TED talk gists (3)


Jon Gosier:The problem with "trickle-down techonomics「下滲科技經濟」的問題


  1. 世界上的科技業往往基於此種假設: 好的東西創造出來一定會正面影響世界上的所有人,最終這些創新的產品都會找到途徑讓所有人使用。 其實不然, 科技和創新就像財富和資本,大多時候他們被掌握在少數人手中,偶而也會落入多數人手上。
  2. 影片四個例子:醫療診療室電子化/數位化與相搭配的數位穿戴裝置、比特幣和其他加密貨幣、圖書數位化與相應的網路/設備、最後是東非的土地所有權數位化與保存紀錄不佳導致風險投資家、投資者、房地產開發商人猛進。
  3. 運用科技取得優勢細節請看影片。
  4. 科技使用還是有門檻的,但大多時候科技難民是不會被發現的。




Mariano Sigman Your words may predict your future mental health「你的用詞可能透露你未來的精神健康狀態」



  1. 沒有足夠的語義資訊來預測未來
  2. 更精確地說,不是他們說的「話」落在哪個語義相近的群組裡, 而是他們說話的「方式」 是否會在這幾個語義相近的群組間快速地跳來跳去---「語義連貫性」的量測方法,測量談話是否會落在同一個語義主題或類別上。
  3. 實驗34位年輕人,透過語義連貫性演算法, 預測精神錯亂的正確率達到百分之百。目前臨床上所有測量方式 都無法達到、或接近這個數字。
  4. 根據自動分析出我們所寫的字、 我們所說的話,客觀、量化的方式評估心理健康模式

內容其實OK,就是文字探勘/語意探勘的應用,要注意的是本篇是英文語系才適用。做過的經驗看,這種東西跟分析的文字語系有關,所以英文歸英文,中文歸中文。



英文世界的語意分析工具相當成熟,例如NLTK等,而中文最常用的工具叫做結巴(jieba )斷字,是個開放套件,應該做中文探勘的都會用到,這是大陸人做的。台灣呢,其實台灣也有
中研院開發的中文剖析系統 - 詞庫小組,而且更細,可以應用對偶、平仄、五言七言絕句之類的,但沒有像結巴一樣做成一個開放工具包讓大家可以隨意使用或是離線使用,要大量使用必須寄信過去申請使用帳戶,上傳檔案對方處理完在下載回來。而處理量也不高,隨時還有突然中斷、資源不夠hang住的可能。

相對之下對岸這塊真的做得好,甚至有些民間公司提供API服務(相比中研院的溝通書信)。或許是人口多競爭多,提供的服務越來越好,雖然我們沒有退步,但不進,則退,我們就默默地就愈來越落伍了.....

沒有留言:

張貼留言

Related Posts Plugin for WordPress, Blogger...