文档

从字符串数组创建词云

这个例子展示了如何创建一个词云从纯文本阅读它成一个字符串数组,预处理,通过它wordcloud函数。如果你安装了文本分析工具箱™,那么您可以创建词云直接从字符串数组。有关更多信息,请参见wordcloud(文本分析工具箱)。

从莎士比亚的十四行诗读课文fileread函数。

十四行诗= fileread (“sonnets.txt”);十四行诗(1:135)
ans = '威廉·莎士比亚的十四行诗我从美丽的生物,我们渴望增加,从而美丽的玫瑰可能永远不会死,”

将文本转换成字符串使用字符串函数。然后,把它在换行字符使用splitlines函数。

十四行诗=字符串(十四行诗);十四行诗= splitlines(十四行诗);十四行诗(14)
ans =5 x1字符串数组“从美丽的生物,我们渴望增加”,“从而美丽的玫瑰可能永远不会死,”“但随着成熟应该随着时间流逝,”“他的他的记忆交给娇嫩的后嗣:“”但你承包你的明亮的眼睛,“

一些标点符号替换为空格。

p = (“。”“?”“啊!””、“”;“”:“];十四行诗=取代(p,十四行诗”“);十四行诗(14)
ans =5 x1字符串数组“从美丽的生物,我们渴望增加”“因此美丽的玫瑰可能永远不会死”“但随着成熟应该随着时间流逝”“他的他的记忆交给娇嫩的后嗣”“但是你承包你的明亮的眼睛”

分裂十四行诗成一个字符串数组的元素包含单个单词。要做到这一点,加入所有字符串元素为1×1字符串然后空格字符分割。

十四行诗=加入(十四行诗);十四行诗=分裂(十四行诗);十四行诗(7:12)
ans =6 x1字符串数组“从”、“公平”、“生物”“我们”“欲望”“增加”

删除单词少于5个字符。

十四行诗(strlength(十四行诗)< 5)= [];

转换十四行诗分类数组,然后使用wordcloud。情节的独特元素的函数C大小对应于频率计数。

C =分类(十四行诗);图wordcloud (C);标题(“十四行诗词云”)

这个主题有帮助吗?