当前位置: 首页 > news >正文

成都网站制作沈阳一个完整网站制作的实例

成都网站制作沈阳,一个完整网站制作的实例,代理公司注册收费,opkg 安装wordpress阿里妹导读#xff1a;一个合格的智能助理能够帮你预约开会时间#xff0c;处理日常办公需求#xff0c;还能打电话提醒你要还信用卡了#xff0c;作为用户或者消费者#xff0c;我们已经越来越习惯对话机器人提供的各色服务。但对于企业来讲#xff0c;搭建提供这些服务… 阿里妹导读一个合格的智能助理能够帮你预约开会时间处理日常办公需求还能打电话提醒你要还信用卡了作为用户或者消费者我们已经越来越习惯对话机器人提供的各色服务。但对于企业来讲搭建提供这些服务的对话机器人是一件门槛及成本都很高的事情。阿里巴巴达摩院小蜜Conversational AI团队的高级算法专家李永彬水德为我们带来了分享——小蜜智能对话开发平台围绕平台来源、设计理念、核心技术、业务落地四大维度讲述了如何赋能各行各业开发自己的对话机器人。 平台由来 为什么要做一个平台我觉得还是从一个具体的任务型对话的例子说起在我们日常工作中一个很高频的场景就是要约一个会议看一下我们内部的办公助理是怎么来实现约会议的我说“帮我约一个会议”它会问“你是哪一天开会”跟它说是“后天下午三点”接下来它又会问“你跟谁一起开会啊”我会把我想约的人告诉它这个时候它在后台发起一次服务调用因为它要去后台拿到所有参会者的日程安排看一下在我说的这个时间有没有共同的空闲时间如果没有的话它会给我推荐几个时间段。由于我说的那个时间段大家没有共同的空闲时间于是我改了时间。 我说“上午十一点吧”它会接着问“你会持续多长时间”我会告诉它“一个小时”它再问“会议的主题是什么”于是我跟它说“我们讨论一下下周的上线计划”到此为止它把所有的信息收集全了最后它会给我一个 summary让我确认是不是要发送会议邀约我回复确认以后它在后台就会调用我们的邮件系统把整个会议邀约发出来。  这是一个非常典型的任务型的对话它满足两个条件第一它有一个明确的目标第二它通过多轮对话交互来达成这个目标。像这样的任务型对话在整个办公行业里面除了约会议以外还有查考勤、请假、定会议室或者日程安排等等。 如果我们把视野再放大一点的话再看一下电商行业电商行业里面就会涉及到开发票、催发货、查物流、改地址、收快递等等也会涉及到很多很多的这样的任务型对话场景视野再放大一下我们再看一下电信行业或者整个运营商的行业里面会有查话费、查流量、买套餐、报故障或者是进行密码的更改服务等也会有大量的这种任务型的对话场景。如果我们再一步去看的话像政务、金融、教育、文娱、健康、旅游等在各行各业的各种场景里面我们都会发现这种任务型的对话它是一种刚需是一种普遍性的存在。 所有的这些场景落地到我们小蜜家族的时候是通过刚刚介绍过的三大小蜜来承载阿里小蜜、店小蜜和云小蜜。我们不可能给每一个行业里面的每一个场景去定制一个对话流程所以我们就沿用了阿里巴巴一贯做平台的思路这也是我们整个智能对话开发平台的由来。这款产品在内部的名字叫对话工厂Dialog Studio。 以上主要是给大家介绍我们为什么要做智能对话开发平台总结起来就是我们目前面临的业务面临的场景太宽泛了不可能铺那么多人去把所有的场景都定制化所以我们需要有一个平台来让开发者进来开发各行各业的各种场景对话。 设计理念 再看第二部分对话工厂的一些核心设计理念。整个设计理念这块我觉得概括起来就是“一个中心三个原则”。一个中心就是以对话为中心这句话大家可能觉得有点莫名其妙你做对话的为何还要强调以对话为中心呢 这是有来源的因为在过去几年全世界范围的技术实践以及直到今天很多巨头的对话平台里面我们能看到的基本还是以意图为中心的设计模式它把意图平铺在这里比如你想完成音乐领域的一些事情可是你看到的其实是一堆平铺的意图列表完全看不出对话在哪里。 我们在这次对话工厂的设计中彻底把它扭转回来对话就是要以对话为中心你在我们的产品界面里面看到的不再是一个个孤立的意图而是关联在一起的、有业务逻辑关系的对话流程。以意图为中心的设计中你看到的其实是一个局部视角就只能实现一些简单的任务比如控制一个灯讲个笑话或者查个天气如果你想实现一个复杂的任务比如开一个发票或者去 10086 里开通一个套餐它其实是较难实现很难维护的。我们把整个理念转换一下回到以对话为中心以后就会看到全局视野可以去做复杂的任务可以去做无限的场景。 整个对话工厂刚刚也说过了它是一个平台要做一个平台就会遇到很多挑战。 第一个挑战就是对用户来说希望使用门槛越低越好第二个挑战是要面对各行各业的各种场景就要求能做到灵活定制第三个挑战是上线以后所有的用户肯定都希望你的机器人你的对话系统能够越用越好而不是停留在某一个水平就不动了。这就是我们平台所面临的三大挑战。 为了应对这三个挑战我们提出了在整个平台的设计以及实现过程中始终要遵循三个原则。 第一个原则是冷启动要快其实就是要让用户的使用门槛低一点第二个原则是要有灵活定制的能力只有这样才能满足各行各业的各种场景需求第三个是要有鲁棒进化的能力就是模型上线以后随着时间的变化随着各种数据的不断回流模型效果要不断提升。 这三个原则里面冷启动这一块其实就是要把用户用到的各种能力和各种数据都尽量变成一种预置的能力简单来说就是平台方做得越多用户就做得越少第二块关于灵活定制就要求我们把整个对话平台的基础元素进行高度抽象你抽象的越好就意味着你平台的适应能力越好就像是经典力学只要三条定律就够了第三块就是鲁棒进化这一块就是要在模型和算法上做深度了语言理解的模型对话管理的模型数据闭环主动学习在这些方面能够做出深度来。以上说的都是一些理念和原则接下来给大家介绍一下具体在实现过程中是怎么来做的。 核心技术 讲到技术这块的话因为我们做的是一个平台涉及到的技术非常广是全栈的技术从算法到工程到前端到交互所有的技术都会涉及到。我摘取里面算法的核心部分来给大家做一个介绍。 对话工厂首先是用来做对话的人机对话有两个主体一个是人一个是机器人有人的逻辑人的逻辑使用什么来表达呢到今天为止主要还是通过语言所以我们需要有一个语言理解的服务来承载这一块机器有机器的逻辑机器的逻辑到今天为止还是通过代码来表达的所以我们需要一个函数计算的服务在人和机器对话的过程中这种对话过程需要有效的管理所以我们需要一个对话管理模块。整个对话工厂最核心的三个模块就是语言理解、对话管理和函数计算。 第一个模块是语言理解。 我们先看一下这个图在整个这个图里面横轴是意图的多样性纵轴是频次这样说有点抽象我举一个具体的例子比如说我要开发票这是一个意图如果去采样十万条这个意图的用户说法作为样本把这些说法做一个频率统计可能排在第一位的就是三个字“开发票”它可能出现了两万次另外排在第二位可能是“开张发票”它可能出现了八千次这些都是一些高频的说法还有一些说法说的很长比如“昨天我在你们商铺买了一条红色的裙子你帮我开个发票呗”这种带着前因后果的句式在整个说法里面是比较长尾的可能只出现了一次或两次。 我们统计完以后整个意图的说法的多样性分布符合幂律分布。这种特征可以让我们在技术上进行有效的针对性设计首先针对这种高频的部分我们可以上一些规则比如上下文无关文法可以比较好的 cover 这一块但是基于规则的方法大家也知道规则是没有泛化能力的所以这时候要上一个匹配模型计算一个相似度来辅助规则这两块结合在一起就可以把我们高频确定性的部分解决的比较好对于长尾的多样性的这一部分基本到今天为止还是上有监督的分类模型去收集或者去标注很多数据把这一块做好在规则和分类模型之间我们又做了一部分工作就是迁移学习模型为什么要引入这个模型呢我们看下一张图。 在冷启动阶段用户在录入样本的时候不会录入太多可能录入十几条几十条就已经很多了这个时候按照刚才那个幂律分布二八原则的话它的效果的话可能也就是 70% 多它不可能再高了。但对于用户的期望来说如果想要上线想要很好的满足他的用户需求其实是想要模型效果在 90% 以上如果想要达到这个效果就需要复杂的模型需要标注大量数据。所以其实是存在一个 gap 的我们引入了迁移学习模型。 具体来说我们把胶囊网络引进来和 few-shot learning 结合在一起提出了一个网络结构叫 Induction Network就是归纳网络。整个网络结构有三层一层是 Encoder层第二层是 Induction归纳层第三层是 Relation 层。 第一层负责将每一个类的每一个样本进行编码编码成一个向量第二层是最核心的一层也就是归纳层这里面利用胶囊网络的一些方法把同一个类的多个向量归纳成一个向量然后第三层 Relation 层把用户新来的一句话和每一个类的归纳向量进行关系计算输出他们的相似性打分。如果我们想要一个分类结果就输出一个 One-hot如果不想要 One-hot就输出一个关系的 Relation score这是整个 Induction network 的网络结构。 这个网络结构提出来以后在学术圈里面关于 few-shot learning 的数据集上我们以比较大的提升幅度做到了 state-of-the-art 的效果目前是最好的同时我们将整个网络结构上线到了我们的产品里面这是语言理解。 第二块我们看对话管理。 对话管理其实我刚刚也说过了如果想要让平台有足够的适应性的话那么它的抽象能力一定要好。对话管理是做什么的对话管理就是管理对话的那么对话是什么呢对话的最小单位就是一轮一个 turn我们进去看的话一个 turn 又分为两部分一个叫对话输入一个叫对话输出在输入和输出中间有一个对话处理的过程就像两个人互相交流一样我问你答但其实你在答之前是有一个思考过程的如果你不思考就回答那你的答案就是没有质量的所以就会有一个中间的对话处理过程。 我们把对话抽象到这种程度以后整个平台就三个节点一个叫触发节点一个叫函数节点一个叫回复节点。 触发节点是和用户的对话输入对着的函数节点是和对话处理对着的回复节点是和对话输出对着的。有了这一层抽象以后无论你是什么行业的什么场景什么样的对话流程都可以通过这三个节点通过连线把你的业务流画出来。 举两个例子先看一个简单的你要查一个天气很简单先来一个触发节点把天气流程触发起来中间有两个函数节点一个是调中央气象台的接口把结果拿过来另一个是对结果进行一次解析和封装以一个用户可读的形式通过回复节点回复给用户。这里面稍微解释一下就是增加了一个填槽节点填槽节点是什么意思呢就是在任务型对话里面几乎所有的任务都需要收集用户的信息比如你要查天气就需要问时间是哪一天的地点是什么地方的这样就叫做填槽填槽因为太常用太普遍了就符合我们冷启动快里面做预置的思想所以通过三个基础节点我们自己把它搭建成填槽的一个模板需要填槽的时候从页面上拖一个填槽节点出来就可以了。 我们再看一个复杂的场景这是在线教育里面的一个外呼场景家里有小孩的可能知道这种在线教育特别火在上课之前半小时机器人就会主动给用户打电话指导软件下载指导怎么登陆登陆进去以后怎么进入教室所有的这些流程都可以通过机器人进行引导。 通过这两个例子我们就可以看到无论是简单还是复杂的场景通过这三种抽象节点的连线都可以实现。有时候我们开玩笑就会说整个这种连线就叫一生二二生三三生万千对话。 讲了抽象以后再看一下具体的对话管理技术。从实现上来说这张图和大家刚才看到的语言理解那张是一模一样的因为很多东西的分布其实是遵循着共同规律的区别在与把意图换成了对话。 举一个例子比如像查天气这样的如果采集十万个查天气的样本对这些用户的说法进行一个频率统计的话大概就是这样一个曲线用两步能够完成的比如说查天气先填槽一个时间再填槽一个地点然后返回一个结果通过这种流程来完成的可能有两万次中间可能会引入一些问 A 答 B 的情况这样的 B 可能有各种各样的就跑到长尾上来了这样整个对话其实也遵循一个幂律分布。 对于高频确定的部分可以用状态机进行解决但状态机同样面临一个问题它没有一个很好的容错能力当问 A 答 B 的时候机器不知道下面怎么接了。在这种情况下需要引入一个类人能力对状态机的能力进行补充状态机加上类人能力以后基本上可以把高频的对话比较好的解决了。对于长尾上的对话目前对于整个学术界或者工业界都是一个难题比较好的解决方式就是上线以后引入在线交互学习不断跟用户在对话过程中学习对话。在状态机和在线交互学习之间其实是有 gap 的因为状态机自己没有学习能力所以需要引入增强学习。接下来我会介绍在类人能力以及增强学习方面的一些工作。 先看一下类人能力。我们把人说的话做一下分类大概可以分为三种第一种就是用户说的话清晰明了只有一个意思这种其实对机器来说是可理解的第二种机器压根儿不知道在说啥也就是 unknown 的还有一种就是用户表达的意思可以理解但是有歧义有可能包含着两个意图、三个意图就是uncertain不确定的。确定性的状态机其实是可以很好地捕捉和描述的类人能力主要关注拒识的和不确定性的。 对于拒识这块比如还是在线英语的这个例子机器人打来一个电话问现在方不方便调试设备这个时候从设计的角度来说希望用户回答方便或者不方便就OK了但是一旦这个用户回答了一个比较个性化的话比如“呃我刚扫完地过会儿可能有人要来”这时候我们的语言理解模块很难捕捉到这是什么语义这时候需要引入一个个性化的拒识比如说“您好不好意思刚才没听明白请问您现在是否方便调试如果您不方便我过会儿再给您打过来”这个就是对话的兜底是对 unknown 的处理。 第二个我们看一下澄清用户说的一句话里面如果是模糊不清的怎么办我们通过大量的数据分析发现这种模糊不清主要出现在两种情况下一种是用户把多个意图杂糅在一段话里来表达第二种是用户在表达一个意图之前做了很长的铺垫对于这两种长句子现在的语言理解给出的是意图的概率分布我们把这个概率分布放到对话管理模块以后就需要让用户进行一轮澄清。比如这个例子这是移动领域的一个例子这句话理解有三种意图到底是想问花费明细还是套餐的事情还是想问合约的低保把这三个问题抛给用户进行澄清就可以了。 从技术上来说是怎么实现的呢我们看一下这个图开发者负责把对话流程用流程图清晰描述出来然后像澄清这种其实是我们系统的一种内置能力什么时候澄清是通过下端的这两个引擎里面的能力来决定的第一块是 Error Detection它用来检测用户当前说的这句话是否需要触发澄清一旦它觉得要触发澄清就会交给下一个模块究竟用什么样的方式澄清以及怎么生成澄清的话术这是目前我们整个智能澄清这块做的工作。 再看一下我们在增强学习方面的工作。在对话管理模型里面经典的分成两个模块一个是 neural belief tracker用来做对话状态追踪的另一个是 policy network用来做行为决策的。在整个框架下要去训练这个网络的时候有两种训练方式一种是端到端的去训练用增强学习去训练但这种方式一般它的收敛速度会比较慢训练出的结果也不好另外一种方式是先分别做预训练这个时候用监督学习训练就好了不用增强学习训练训练完以后再用增强学习对监督学习预训练的模型进行调优就可以了。 无论是端到端的一步训练还是先预训练再调优只要涉及增强学习这一块都需要有一个外部环境所以在我们的实现架构里面引入了模拟器的概念就是user simulator。模拟器这主要分为三大块一个是 user model用来模拟人的行为的第二个是 error model模拟完人的行为以后经过 error model 引入一个错误扰动用 user model 产出的只是一个概率为 1 的东西它对网络训练是不够好的error model  会对这个结果进行扰动并给他引进几个其他的结果并且把概率分布进行重新计算一下这样训练出的模型在扩展能力或者泛化能力上会更好一些第三个模块是 reward model用来提供 reward 值。这是我们今天在整个增强学习的对话管理这块的一些工作。 最后看一下函数计算。 函数计算是什么东西呢还是举一个例子吧比如说10086 里面用户说要查一下话费10086 那边的机器人就会回复一句是发短信还是播放语音表面看来就是简单的一入一出其实在这背后要经过多轮的服务查询才能完成这个结果因为当要查话费的时候先要经过函数计算查一下现在是哪一天如果是下账期的话是不能查话费的就是每个月的最后一天不能查话费如果可以查话费的话先看一下用户是否存在话费如果存在花费的话第三步调用的服务看是不是停机了因为停机了的话只能语音播报不能接收短信。所以看一下在一个简单的一入一出的对话背后是走了一个复杂的流程的这些流程今天都是在机器端用代码来实现的。函数计算的引入使对话工厂可以去处理复杂的任务。 业务应用 最后我们看一下对话工厂的业务应用情况。这是我们在浙江上线的 114 移车当有市民举报违规停车挡路后就会自动打一个电话让他移车。第二个是在金融领域里面关于贷款催收的例子。在刚刚过去的双十一里面对话工厂在整个电商里面也有大量应用主要是在店小蜜和阿里小蜜里面。 店小蜜主要是一些开发票、催发货、改地址这样的流程这里是一个开发票的例子用户可能会先说一个开发票进来以后要进行复杂的流程一种是在说的时候其实他已经把它的订单号送进来了如果没有说订单号的话需要去后台系统查订单号查出来以后弹一个订单选择器选择订单接下来如果是个人发票就走这个流程如果是公司发票走另一个流程接下来会问是普通发票还是增值税发票如果是普通发票接着往这儿走如果是增值税发票需要获取企业增值税的税号最后汇总到一个节点调用后台开发票的系统把发票开出来。这是这次双十一里面用到的开发票的一个例子。 阿里小蜜主要是负责阿里巴巴集团内部各个 BU 的业务手淘是一个最大的业务进入手机淘宝以后进入“我的”里面有一个客服小蜜就是阿里小蜜上个月我们刚刚在优酷上线了优酷小蜜星巴克是 9 月份上的是属于新零售的一个最大的尝试点还有很多其他的场景。 在钉钉上通过智能工作助理对话工厂为千万企业提供智能考勤、智能人事等对话服务。 最后看一下我们整体的落地情况。目前整个对话工厂在阿里巴巴经济体内部各业务如淘宝、优酷、盒马等、淘宝天猫上的商家、钉钉千万量级的企业、公有云企业、私有云重点行业政务行业、运营商行业、金融行业等、国际化东南亚新加坡、印尼、越南、泰国、菲律宾、马来西亚等6国等业务中开始大规模应用赋能各行各业开发者自主构建对话机器人。 原文链接 本文为阿里云原创内容未经允许不得转载。
http://wiki.neutronadmin.com/news/53208/

相关文章:

  • 中国工信备案查询网站vps 上怎么做网站
  • 谁家网站做的好建设工程检测报告查询网站
  • 网站建设与策划试卷邢台贴吧网络最新消息
  • 门头沟营销型网站建设wordpress不用ftp
  • 镇江市网站建设wordpress中途修改固定连接
  • 网站优化解决方案学做网站论坛会员账号
  • 如何申请域名邮箱郑州搜索引擎优化公司
  • 深圳58网站建设做满屏网站的尺寸
  • 深圳企业网站制作中心我要做一个网站 需要营业范围吗
  • 生活服务网站开发网站建设项目甘特图
  • 外贸网站建设网站优化广州洛可可设计公司
  • 著名设计师网站网页制作的平台
  • 网站做百度推广怎么推广网站00后没学历最吃香的职业
  • 公司网站外包建设没有源代码有哪些营销型网站
  • 如何建设一个收费的影视图文网站网站动态图标
  • 如何添加网站 ico图标邢台信息港123招聘
  • 桦南县建设局网站国内高清视频素材网站
  • 网站制作html代码网站三层结构示意图
  • 黑龙江省建设教育信息网网站wordpress表前缀是什么
  • 电商网站设计公司力荐亿企邦公司的网络拓扑图
  • 亚马逊网站网址天元建设集团有限公司开票信息
  • 外贸仿牌网站建设免费建自己域名的网站吗
  • 徐州网站建设网络推广wordpress静态页没有标题
  • 手机网站优化需要注意什么企业vi案例
  • 生物科技公司网站模板东莞网站建设时间
  • cms影视建站系统免费windows云电脑
  • 网站搭建后提示建设中广州seo网站优化培训
  • 公司起名免费网性能优化工具
  • 阿里云搭建公司网站seo咨询邵阳
  • 华为云云速建站怎样福州商城网站