——————分割线——————
——————2019.10.11——————
看完了前两章,开始看第三章。
第1章是绪论,第2章是模型评估与选择,第3章是线性模型。
第1章1.1 引言讲了西瓜故事,然后1.2 基本术语介绍了分类、回归、二分类、多分类、聚类。监督和无监督学习。1.3 假设空间说了这是属于广义归纳学习以及假设空间。1.4 归纳偏好提到奥卡姆剃刀和NFL定理,提到具体问题才是关心的。1.5 发展历程。1.6 应用现状。1.7 阅读材料提到深度学习、多释原则、重要的学术会议。习题冇啥好说的。
第2章2.1 经验误差与过拟合,介绍过拟合与欠拟合,2.2 评估方法,留出法、交叉验证法(常称k折交叉验证)、自助法(笔记1/e≈0.368)、调参与最终模型。2.3 性能度量,最基础的错误率与精度,查准率P、查全率R和F1度量,ROC(受试者工作特征)曲线,AUC(ROC曲线下面积),代价敏感错误率与代价曲线,有个期望总体代价。2.4 比较检验里的假设检验、交叉验证t检验、McNemar检验、Friedman检验和Nemenyi后续检验。后几个不大懂。2.5 偏差与方差也写的很腻害的样子。仔细看了前面也还行能懂,泛化误差可分解为偏差、方差与噪声之和。2.6 阅读材料罢说了。
感觉第二章看了一万年,原来只是单纯地搞出模型之后的处理吗?但是想想内容的确不少,主要评估的模型而不是数据。
第3章刚看一面看到了转置矩阵,略微激动,把线性代数教材也拿下来放在了笔记本旁的常用书架,高等数学和概率论早拿下来了。
说起来多是查概率论课本,什么概率密度函数什么贝叶斯公式都是在概率论里面,但是高数又是基础,emmmm。
我有预感,这名为线性模型的第3章一定能让我看到爽。比起第1章的轻松,第2章紧迫懵懂,第3章想必一定能给我带来踮起脚尖的新知识体验。
期间免不了翻看《高等数学》、《概率论与数理统计》、《线性代数》,也肯定爽到爆。
——————分割线——————
——————2019.10.12——————
我就知道,这几把玩意机器学习就是数学的高级应用,艹艹艹艹艹艹艹艹艹。
怎么说呢,也不是也没特别难,就是麻烦,就是喜欢搞复杂,搞我的时间,我就忽略性地看,大致数学方法都明白,毕竟高数线代是学过的。
什么均方误差、arg min、什么最小二乘法、什么满秩矩阵、什么对数几率函数、什么Sigmoid函数、什么极大似然法,倒不是看不懂,但是真滴要仔细认真看才能看懂,看的超慢的。
我想跳着看了。但是这些数学原理方法是机器学习的基础,日。
我决定去看一下单片机冷静一下。
……
two hours later
……
单片机也难受的一批。
然后我不是在图书馆嘛,然后从身后的书架翻了一本娃娃书看。
叫《建筑表现技法》。
好多画画技巧。画的真好。
——————分割线——————
——————2019.10.24——————
某个IT行业大佬在某个行业大会上说目前的人工智能都算不上真正的人工智能,都只是机器学习。
那么我们今天来具体看看机器学习到底能做什么。
反正我翻了这本书,越来越发现就是一种用数理统计方法做任务的感觉。
首先,分类任务,让机器学习能分辨好坏,这是人工智能的基础,“yes/no”。“what”现在虽然发展的不错,但其实更加复杂一点。
回归任务,给数据做个数据估计。比如:西瓜的成熟度。
多分类,渐渐感觉有“what”的意思了。想起了各个专业的识别功能。比如拍照识花,比如拍照识别,拍照最基本的功能人脸确认,微笑确认等。机器学习,正以我们察觉不深的程度优化我们的生活。
但我们从来知道,科学是把双刃剑,使用者的良善之心才是重中之重。而盈利组织也通常会越来越使用更高超的技术手段。这个以后再聊。继续说机器学习。
多分类任务,已经初具人类可以察觉的人工智能水平了。
“这是什么?”人类问。
“这是灯泡,又叫富士山,是番杏科肉锥花属的多肉植物。要我介绍一下详细信息吗?”机器学习的产物如此说道。
而无监督学习的聚类学习,则还要腻害一些。因为监督学习,做的是简单工作,聚类学习的结果,可能超出人类的预期。
因为它能通过大量数据发现不同的“簇”,这个是很腻害的。数据够多够好,算法够好,也许甚至能帮助人类探索学科前沿的知识。
单单是这些分类、聚类啊,已经可以在提高人类生活水平方面做出巨大贡献了,有很广阔的应用前景。
我想做的是,人工智能写网文。现在已经有写假新闻的人工智能了,关于自然语言处理方面也许正等着我焦某人拨开这万古迷雾,还这世间一个朗朗乾坤。