解决gensim fasttext官方案例报错TypeError: Either one of corpus_file or corpus_iterable value must be provide
  TEZNKK3IfmPf 2023年11月14日 39 0

完整报错为:TypeError: Either one of corpus_file or corpus_iterable value must be provided

解决方法

将官方案例中传递参数时指定的sentences=删除即可,比如:

model.build_vocab(sentences=common_texts)
model.train(sentences=common_texts, total_examples=len(common_texts), epochs=10)  # train

改为:

model.build_vocab(common_texts)
model.train(common_texts, total_examples=len(common_texts), epochs=10)  # train

问题解析

在gensim4.0+中,不再需要sentences=来指定传入的数据,但是官方案例没有更新,因此直接使用案例会报错没有提供数据。官方案例如下:

from gensim.models import FastText
from gensim.test.utils import common_texts

model = FastText(vector_size=4, window=3, min_count=1)  # instantiate
model.build_vocab(sentences=common_texts)
model.train(sentences=common_texts, total_examples=len(common_texts), epochs=10)  # train

正确的案例:

from gensim.models import FastText
from gensim.test.utils import common_texts

model = FastText(vector_size=4, window=3, min_count=1)  # instantiate
model.build_vocab(common_texts)
model.train(common_texts, total_examples=len(common_texts), epochs=10)  # train
【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月14日 0

暂无评论

TEZNKK3IfmPf