wordpress如何生成网站地图,wordpress 下载远程图,led企业网站策划,长鳖春遇网站开发来源#xff1a;Jerry的算法和NLPJerry的算法和NLP先说下结论#xff1a;没有一个模型是万能的#xff0c;需要根据数据选择适合的模型。在机器学习中#xff0c;数据大概可以分成四大类#xff1a;图像 (Image)#xff0c;序列(Sequence)#xff0c;图(Graph) 和表格(T… 来源Jerry的算法和NLPJerry的算法和NLP先说下结论没有一个模型是万能的需要根据数据选择适合的模型。在机器学习中数据大概可以分成四大类图像 (Image)序列(Sequence)图(Graph) 和表格(Tabular) 数据。其中前3类数据有比较明显的模式比如图像和图的空间局部性序列的上下文关系和时序依赖等。而表格数据常见于各种工业界的任务如广告点击率预测推荐系统等。在表格数据中每个特征表示一个属性如性别价格等等特征之间一般没有明显且通用的模式。神经网络适合的是前三类数据也就是有明显模式的数据。因为我们可以根据数据的模式设计对应的网络结构从而高效地自动抽取“高级”的特征表达。如常见的 CNN (卷积神经网络) 就是为图像而设计的RNN (循环神经网络) 为序列数据而设计的。而表格数据因没有明显的模式非要用神经网络的话就只能用低效的全连接网络一般效果都不太好。在实践中对于表格数据除了专门对特定任务设计的网络结构如DeepFM等更多时候还是用传统机器学习模型。尤其是 GBDT (梯度提升树)因其自动的特征选择能力及动态的模型复杂度算得上是一个万金油模型在各种类型的表格数据上都表现很好。但对于表格数据而言其实特征工程才是更关键的。在给定数据的情况下模型决定了下限特征决定了上限。特征工程类似于神经网络的结构设计目的是把先验知识融入数据并且让模型更好地理解数据让模型可以学得更好。另外神经网络实质上不算是一个模型而是一类可以自由“搭积木”的模型。结构不同的神经网络可以认为是不同的模型了。总结下no free lunch没有一个万能的模型可以直接用于各种数据。有多少人工就有多少智能用神经网络的话你需要结构设计而用传统模型的话你需要特征工程。首先说大家熟悉的监督学习任务比如分类和回归。神经网络的优势要在数据量很大计算力很强的时候才能体现数据量小的话很多任务上的表现都不是很好。SVM属于非参数方法拥有很强的理论基础和统计保障。损失函数拥有全局最优解而且当数据量不大的时候收敛速度很快超参数即便需要调整但也有具体的含义比如高斯kernel的大小可以理解为数据点之间的中位数距离(Median heuristic)。在神经网络普及之前引领了机器学习的主流那时候理论和实验都同样重要。决策树也是非参数方法之一。我的经验告诉我很多时候随机森林要比SVM要好而且森林的训练时间可以很短但感觉超参数调节上不是很intuitive几棵树收敛条件都需要一个个试。神秘网络拥有很多局部最优而且理论上过拟合很容易但各种tricks神奇的避免了这些理论弊端但很多时候人们并不清楚它的工作和训练原理而且泛化能力为什么高(各种竞赛结果)/低(对抗样本)也没有解释。在给定计算量下神经网络基本上没办法和传统方法比。好在GPU解决了这个弊端。总之当数据量小的时候传统方法依靠理论保障(kernel methods)或者用先验(贝叶斯方法)来控制解的空间通常会有很好的表现。再说一些光看神经网络还用不到的任务。答主可能也只是问在监督范畴内传统方法有什么价值。但我想在更广泛的背景下介绍一下传统方法的意义何在。一般认为监督式学习是已经解决了的问题所以最前沿的理论研究都集中在非监督领域。炼丹在此略过。非监督学习领域虽然神经网络也被用作模型一部分但主要还是以方程近似的角色体现。GANNormalizing flow, VAEenergy-based models... 这些方法还依靠统计理论。比如kernel methods加上神经网络可以用于密度估计但主要的原理还是建立在传统体系下(max likelihoodscore matching等)神经网络只不过是更复杂的kernel超参数而已。最后提一项神经网络基本不可能用到的任务假设检验是非常重要的科研工具用在很多关键领域上。医学上判断药物是否有作用社会学上判断一项政策是否改变了社会参数金融上判断两只产品的之间是否有关联机器学习上判断两个GAN生成的图片那个更真实…都需要用到假设检验。大家熟悉的t-test, rank test, K-S test等都只适用于一维数据而且数据的收集可能不理想(比如长期监测的病人提前退出测试)数据本身并不满足参数性假设(如残差为高斯分布)…如果要开发一项检验方法需要控制Type-1 error也就是当H0为真的时候错误拒绝H0的概率。这个时候神经网络这个黑箱就成了很大的障碍因为没有任何理论基础。而kernel方法依靠深厚的理论基础可以在几乎没有任何数据分布假设下从数学上给出Type-1 error的保障也就可以被用在很多关键领域的检测。同时数据收集不理想的时候也可以通过一大堆数学推倒来实现这些test。如果有了黑箱那基本就相当于把理论给扔了。未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。 如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”