开启NLP新时代的BERT模型，是怎么一步步封神的？

发布时间：2018-12-14 14:34:48 所属栏目：资讯来源：视觉中国文｜脑极体 NLP领域的伸手党们，上个月简直像在过

导读：原标题：开启NLP新时代的BERT模型，是怎么一步步封神的？图片来源：视觉中国文｜脑极体 NLP领域的伸手党们，上个月简直像在过年！不仅号称谷歌最强NLP模型的BERT如约开源了，而且最新版本还支持中文，可以用于中文命名实体识别的Tensorflow代码！最关键

BERT使用了超大的数据集（BooksCorpus 800M + English Wikipedia 2.5G单词）和超大的算力（对应于超大模型）来在相关的任务上做预训练。未来，是否有足够的训练语料来复现同样的效果，又是否足够的GPU（背后就是钱）来支撑跑BERT，将是智能语音技术企业拉开身位的关键。

总而言之，BERT在NLP界还是个新生事物，但已经有了封神的潜质。比此前的解决方案更优秀，更有发展潜力。

不过，对数据规模和算力的要求，以及与自身业务的耦合，也在无形中提升着智能语音的门槛和成本。

从这个角度看，最终能够借助BERT拉开竞争区位的，要么是搜狗、阿里、百度这样以搜索、电商为主业的大数据“富一代”，要么是凭借强大效率与业务创新实现“弯道超车”的新独角兽，接下来恐怕可以激发不少新脑洞和解题思路。

无论如何，BERT的出现，终于让专注“跑分”和“隔空叫板”的NLP领域，多了一些更有趣的想象力。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

（编辑：青岛站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

最新卡巴斯基端点安全	携程商旅赋能酒店数字
Dable荣获亚太地区前5	电子标签拣货系统，助