Open yuedajiong opened 1 month ago
Should that even be the goal? My understanding is that the authors believe KAN has such potential, which in turn improves interpret-ability, but extracting symbolic representation should not be the goal.
个人看法,水平有限,欢迎指正。
感谢回复! 确实有些离题太远。我尽量简短回复,我的意思,无论是可解释性还是符号提取,都不必是pykan的目标。我个人的看法,单靠统计学习是无法产生符号知识的。
大家好,感谢大家的讨论。KAN(对于所有模型都是这样)最终是否有用取决于你的应用是什么。可解释性是一个挺主观的东西,不同领域的人对什么东西可解释不一样。比如科学领域,函数就是语言,KAN是有帮助的。对自然语言,人类的概念确实很难用函数去表达,KAN就不行。另外符号回归到底是离散(Search)还是连续(训练神经网络)做,现在还没有定论,只是我个人的偏好,很难说谁好谁坏(还是看应用场景)。
谢谢两位大神的回复和指点。
我其实也是很认真的在做ASI方向的,也是从头在思考和设计很底层的算法,包含表示和优化。
我心里保持了几个非常高阶的应用场景,作为我设计底层算法的时候,看是否算法成熟,通过scale-law就能达到ASI的程度。 当然,笼统的说,就是一个活生生的人的非理性和理性思维能力。 其中2个场景/应用: 一个场景,是WorldDream,交互式动态立体世界的生成/重构:这个场景,除了商业上的考虑之外,从技术上说,它强迫我去思考那种超高维度的输入,看起来直观但复杂的x->y的关系;当然更远可能会想,能否自发的从rgb最后智能体如果要很好的对世界建模就必须产生出red这样的抽象概念,说的比较玄一点,如果世界重来,人类2.0是不是必然会产生类似red这样的主观概念。 另外一个场景,是Mathink/Mathinker,机器数学家,它强迫我去思考我的算法,能否从简单的count开始,到group这种抽像的概念。 如果尝试将“古今数学思想”这种数学思维发展的过程能够被“计算”化表示,从范畴论的角度:数学对象如何扩展的,态射如何发展的。 从“法”到“算法”到“形式化/符号化”,到“计算法”,“证明法”到“反证法”,... 这些在一个ThinkerMachine中如何被表示和被学习。没有微分如何被发明出微分,没有无限如何被发明出无限,(如果类推能知道数学的下一个类似“无限”这种级别的概念,那无疑是真正的ASI)......
除了KAN这种很有启发的东西,最近有个Symbolica也值得关注,他们想把范畴论带入到code-level,不知道很够走到多高。
我现在隐约觉得的路:(一定程度上又大脑的实例作为证据)
底层和大脑一样,就是NN这种连接主义,对应到计算机实现,就是张量和张量上的计算。 最通用的的表示和计算,就是张量与计算。 比如:红色有一个张量(具体实现可能简化为向量),红色的抽象颜色也有一个张量,计算形式就是张量和对应函数的。这种抽象关系(树或者更复杂的结构关系,比如属于关系),可以体现在张量和对应的函数上。 那我们AI/ML的过程,就是优化类似word-embedding这个空间类似,和学习这些对象之间的关系的函数。 从张量到符号,其实是个对学习“稳定”的张量,做"label-it"的过程。 这个学习过程,我觉得可以置于这种范式之下(之一):world = function_composed(functions_deterministic, parameters_constant, parameters_random) 当能容忍“一定范围”的随机噪音的时候,我可以开始标定,比如红色这种概念的出现;当可以完全消除噪音的时候,我们可以得到数学级严谨的公式。 --- 这一部分,我与当前主流的研究中不同,我能看到的就是大家倾向于用一个单纯的张量来表示一个符号/对象;我倾向于用张量和张量上相关的计算,联合起来表示一个符号/对象,具体到实现就是一个“含参子网络”。
当然,人脑是生物限制,计算机符号部分完全可以直接符号化计算;但得考虑符号产生,和混合系统的优化。
总之:
I am pessimistic about 'extracting symbolic representations through regression'. The feasible path as I understand it is: (abstraction + (search and/or (heuristic-guessing + validation)))