2018年6月4日星期一

fasttext初学习

第一步:理解
https://www.leiphone.com/news/201608/y8rhWEglraduqcOC.html

第二步:官方文档
  fasttext库有两个主要的用例:词表征学习(应该是向量表征)和文本分类。

1.词表征学习(word representation learning)
为了获取词向量,

./fasttext skipgram -input data.txt -output model

data.txt是utf-8编码的文件,生成model.bin和model.vec. model.vec是词向量表征,model.bin是包括模型的参数信息和所有的超参数。二进制文件稍后可用于计算词向量或重新开始优化

1.2.为词外特征获取单词向量

没有评论:

发表评论

leetcode 17

17.   Letter Combinations of a Phone Number Medium Given a string containing digits from   2-9   inclusive, return all possible l...