◦
▪
▪
◦
▪
▪
•
© 版权声明
THE END
◦
抓取商品数据时,按销量排序,只抓取销量大于3000的商品
▪
销量大于3000可能会遗漏很多品,但只作为继续深挖的基础数据量应该也够了
▪
还有一个原因就是影刀跑手机自动化效率很低,还得防止触发app的风控,要是能多台手机批量跑,再加上从跑出来的商品进入店铺进一步抓取的话,可以获得很多数据,价值不低。
◦
数据只经过AI的初步筛洗(通过商品标题简单判断),所以可能会有重复项或者小部分非虚拟商品
▪
其实可以根据商品标题和商品详情页里的预计发货时间结合起来让AI判断是否是虚拟品,毕竟大部分虚拟品发货速度都很快,但这一步我没有做,没有获取商品的预计发货时间
▪
有AI的初步清洗,应该可以节省一些后续人工洗数据的成本
•
AI NB
暂无评论内容