机器学习面试知识点一(无监督和有监督算法的区别)
对监督学习的理解:
监督学习,通俗来讲就是分类,就是把训练样本,在某种评价下得到最佳的模型,然后再利用这个模型将输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的。在人对事物的认识中,我们从孩时就被大人们教授这是鸟,那是房子等等。我们所见到的景物就是输入数据,而大人们对这些事物的判断结果就是相应的输出。当我们见识多了以后,脑子就慢慢地得到了一些泛化的模型,这就是训练得到的那个函数,从而没有大人在旁边指点的时候,我们就可自己分辨哪些是房子,哪些是鸟。
对无监督学习的理解:
它与非监督学习的不同之处,在于我们事先没有任何训练样本,而直接对数据进行建模。比如我们去参观一个画展,我们完全对艺术一无所知,但是欣赏完多幅作品之后,我们也能把它们分成不同的派别。比如哪些更朦胧一点,哪些更写实一些,即使我们不知道什么叫做朦胧派,什么叫做写实派,但是至少我们能把他们分成两个类。无监督学习的里典型的例子就是聚类。聚类的目的在于把相似的东西聚在一起,而我们并不关心这一类是什么。因此,一个聚类算法只需要知道如何计算相似度就可以开始工作了。