【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
双拼初学者,没有大量数据支撑,只谈 个人感受(日平均输入在一...
严重怀疑当年的 P7 是一场“意外”~ 当初 P7 ...
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最...
我的看法是资金链快断了 5月增长的销量百分比太低,无法供养固...
Windows Server有个功能叫域,它类似统一认证,开...
被美国驻军的发达国家,哪一个不是心里偷着乐? 拿德国举例,3...
在线客服 :
服务热线:
电子邮箱:
公司地址: