word2vec是Google開源的word to vector工具,通過將詞映射到N維的向量空間,然後基於這個進行聚類、找近似詞以及詞性分析等。基本上word2vec適用於mac系統或linux系統,所以若要在win系統上使用, 可以使用Python virtualenv 虛擬環境如:Anaconda,或者利用GENSIM包中的word2vec。
Google Analytic
2015年10月18日 星期日
2015年10月8日 星期四
2015年10月6日 星期二
2015年10月2日 星期五
Mongomdb與Hadoop的連接套件 mongo-hadoop connector
最近推出一個mongomdb與hadoop間的溝通利器:mongo-hadoop connector [Github]
提供Mongodb與hadoop ecosystem之間的溝通,根據資料可以與以下做傳輸
提供Mongodb與hadoop ecosystem之間的溝通,根據資料可以與以下做傳輸
- Pig
- Spark
- MapReduce
- Hadoop Streaming
- Hive
- Flume
進入後按照步驟執行應該會順利得到相關的jar檔,但因為某些原因我在一開始就卡住了,所以提供其他方法
在最開始的步驟./gradlew jar
- $HADOOP_HOME/lib/
- $HADOOP_HOME/share/hadoop/mapreduce/
- $HADOOP_HOME/share/hadoop/lib/
訂閱:
文章 (Atom)