谷歌人工智能创建模型ALBERT 可提高BERT的训练速度

更多精彩尽在这里,详情点击:https://morethangolftours.com/,布鲁格曼

在斯坦福问答数据集基准(SQUAD)上,ALBERT得分为92.2,在通用语言理解评估(GLUE)基准上,ALBERT得分为89.4,在通过英语考试获得的理解(RACE)基准上,ALBERT分数为89.4%。

ALBERT是基于BERT的转换衍生版本,根据三发表的一篇论文介绍,它可以“使用参数约简技术,来降低内存的消耗,提高BERT的训练速度”。据可靠消息,该论文将于2020年的4月份,与其他被接受发表的论文一起,在埃塞俄比亚亚的斯亚贝巴举行的国际学习表征会议上,供各国代表参考。

论文中写道,“我们提出的方法使模型的规模比原来好得多。此外,我们还使用了一种自我监督的模式,该模式侧重于对句子间的连贯性进行建模,并表明它始终有助于下游任务的多句输入。”

ALBERT是BERT的最新衍生品,在主要的基准测试中全都名列前茅。5月,微软的人工智能研究人员引入了多任务深度神经网络(MT-DNN),该模型在9个GLUE基准测试中有7个取得了高分;7月底,Facebook的人工智能研究引入了RoBERTa模型,效果显著。模型

每个模型的性能都超过了人类的平均水平。在其他与变压器相关的新闻中,初创公司Hug Face的PyTorch库可以很方便地使用像BERT这样的主流变压器模型,Open AI的GPT-2和谷歌的XLNet通过长时间的研究,使该库可用于TensorFlow。该公司首席执行官克莱门特德兰古告诉VentureBeat网站,自今年年初以来,PyTorch-Transformers已经安装了超过50万台Pip,实际效果令人非常满意。

发表评论

电子邮件地址不会被公开。 必填项已用*标注