“一个不起眼的小角色却承载着一颗星球的希望 ”
01—开普勒452b上的故事
天鹅座,开普勒452b,一颗距离地球1400光年的类地行星,在这颗酷似地球的星球上,同样存在着生命,同样存在着文明:一个延续了距现在2000多年的文明… …他们仿佛是另一个“我们”!
不幸的是,这颗星球即将迎来坍缩,它的骨架元素——铬,即将被其恒星的熊熊烈焰熔尽… …
但开普勒星流传着一个传说:在仙女座主星系M31星系4000亿颗恒星中的最亮的,也就是最边缘的γ75_3恒星核内,存在着宇宙中所有铬元素的起源,锁定到这颗恒星,开普勒452b将获得拯救!开普勒星(以下简称K星)人也十分清楚:这是一个无从考证的传说,而整个星球似乎也没有足够的资源支撑飞行器探索这颗恒星... ... 但这是唯一的方法!
在开普勒星球上有一座神庙,里面有一座石碑已矗立千年有余,碑文记载了先贤们的多次尝试:去达M31星系要绕过无数颗脾气暴躁的红巨星和超巨星,还有稍不留神就被其吞入腹中的黑洞,暴力穿越意味着同样的结局!唯一的途径就是通过星际高速公路——一个充斥着各种奇怪星体,随时可能将飞船撞毁、融化甚至吸入黑洞的神奇引力走廊(通过星系之间的某种神奇作用力将经过的具有初始速度的天体或者飞船甩出去,通过精确计算理论上有可能借助这种天体之前的作用力通过所有天体而几乎不会在行驶上消耗资源)。而开普勒先贤们也确实曾疑似发现了这条路径,只不过在发回这一信息之后被黑洞吞噬,因为这条信息之后再无任何信号。
准确地说,这条走廊就是一个个超大星体拉格朗日点的连线,只要完全按照引力走廊的路线行驶,就可以避免任何一个星体的超强引力干扰,同时可以把飞船剩余能源封存,用于星际高速公路出口至γ75_3星的未知旅途。
想要在层层迷雾中做出正确的判断,找到星际高速公路的入口以及沿途的所有拉格朗日点并最终到达γ75_3星,是摆在K星人面前真正的挑战。
是时候做出决定了!
02—掉书袋
把计算机想象成人的身体(芯片是大脑,摄像头是眼睛,音频接口是耳朵和嘴巴可以发声和听),把计算机程序想象成人的思想,那么:
【1】 人工智能:在计算机上写一段程序,让程序能听、能说、关键能思考
【2】 机器学习:是实现人工智能的一种方法,这种方法主要是让计算机上的程序利用统计学、概率学、线性代数、数学分析等一些数理知识能更科学合理地听、说及思考。
【3】 模型:计算机程序针对一个任务(比如下围棋的AlphaGo)学到了如何像人一样执行任务的一个结果就是一个模型,模型主要是执行任务的一些网络结构和参数(就像围棋的一些规则和策略)
【4】 参数:拿围棋来说,模型的参数就是:看到现在棋盘上的局面,我应该在哪里落子,可能有多种可能的落子方式,但是不同的位置对我方局面的有利程度不一样,参数刻画了这个“程度”
【5】 模型训练:从不会下围棋,到慢慢知道规则,再到非常擅长甚至是精于围棋有一个学习的过程,人工智能也有一个训练过程,这个过程就是通过程序在计算机上不断调整参数模拟不同的局面并判断这些参数是否能赢。
【6】 测试或推理:模型推理就是利用训练好的模型在新的任务上执行一遍验证一下效果,就好像你说你围棋水平九段,下一盘看看效果
【7】 训练数据:以下围棋为例,计算机程序的训练过程需要训练数据,这个数据就是不同的落子策略、先后、不同位置的对弈数据;简单说一条数据就是一次围棋比赛、或者一次落子位置等等
【8】 监督训练:监督和无监督是针对于训练任务而言的,仍然以下围棋为例,监督训练是知道指采用的数据是否有利于赢棋,通俗讲就是知道这样下是好是坏,这样的数据一般是提前准备好的,比如参考历史上优秀棋手的对弈数据。
【9】 无监督训练:不知道这样下是好是坏,只能自己探索
【10】 过拟合:针对一个具体场景或者任务匹配到几乎一丝不差的程度,但是一旦切换一个场景就容易失效,比如下围棋的时候针对一个选手研究得十分透彻,对方的每一步都在你的预料之中,但是可能换一个选手他的策略并不完全跟现在这个选手一样,那学到针对现在选手的一些策略和落子方式在对弈新选手的时候就很容易失效。
03—参考文献
1. 关键字:《统计学习方法》、李航
2. 关键字:《机器学习》、西瓜书、周志华
3. 关键字:coursera + perceptron、感知机