关于网站内容更新的问题!!
近期有网友反映!自己有个算法!是关于网站内容更新的,通过这个算法能实现网站文章原创度的大幅度提升,还能间接的拉伸关键词。
如下:
这个网友建议!!通过挖词,找到100+目标词和长尾词,通过扫描识别相关关键词,得到文章,那么现在为了减少工作量和保证关键词能和文章对的上,我就需要机器来帮我把关键词归到每个文章上去!!
大致的文章关键词组合为;
1.SEO筹划是什么?——seo、筹划、是、什么
2.怎么为网站优化?——怎么、为、网站、优化
分别到文章中找出现的频率,得到以下结果
seo、筹划、是、什么——取最小值,词完整出现1次
怎么、为、网站、优化——取最小值,词完整出现2次
最后网友还建议!就可以把这2个词都归到这个文章上,做关键词,如果词没有完整出现,那么就不把这个词归到文章上。
小编阅读了,网友这个大致的思路都敬佩不已!!这样可以,是可以!但小编认为这样组合并不影响原创度,就算出来了还是得提高原创度,用机器提高原创度又会造成语义不通顺,到最后还是得人来做。这个只能帮助你快速收集材料,但最后还得人来操作。当然就算换了也达不到70%的原创度。最好的办法还是了解业务,了解产品,自己中译中。我是做机械的,那群同行用工具把文章全打散了,面目全非。
因为即便是按照你的逻辑进行了,也不能证明词完整出现,因为可能是词分开出现的。另外词不完整出现在文章也可以做关键词,主要是相关性,这种只适合养站,而且需要域名有一定的基础才能快速起来,用程序是可以实现的,可以不用书本,直接用关键词搜索百度前50名的网址采集文章,过滤广告之后存储,发布时利用标题分词,再利用分词去检索文章,词频是增加了,但是可读性会差一点。
最后小编建议!!可以按照你的逻辑进行写代码,但是加一道人工审核,来判断是否和你的需求相关。