Gödel Test: Can Large Language Models Solve Easy Conjectures?
Тест Гёделя: Могут ли большие языковые модели решать простые гипотезы? В данной статье представлен тест Гёделя, метод оценки способности больших языковых моделей (LLM), таких как GPT-5, решать новые, простые гипотезы в высшей математике. Авторы протестировали GPT-5 на пяти гипотезах в комбинаторной оптимизации, предоставив только исходные статьи, связанные с каждой проблемой. GPT-5 успешно предоставила почти правильные решения для трех более простых задач, даже опровергнув одну гипотезу с помощью валидной альтернативы. Модель испытывала трудности с задачами, требующими синтеза информации из нескольких источников. Исследование подчеркивает потенциал LLM в рутинных рассуждениях и проявлении оригинальности, но также и ее ограничения в сложном решении проблем и перекрестном анализе. Результаты показывают, что LLM продвигаются к доказательству математических гипотез, но все еще сталкиваются с проблемами. Исследование также подчеркивает необходимость проверки доказательств, сгенерированных LLM, человеком. #БольшиеЯзыковыеМодели #Математика #ИИ #ТестГёделя #КомбинаторнаяОптимизация #GPT5 #Гипотезы документ - http://arxiv.org/pdf/2509.18383v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
Тест Гёделя: Могут ли большие языковые модели решать простые гипотезы? В данной статье представлен тест Гёделя, метод оценки способности больших языковых моделей (LLM), таких как GPT-5, решать новые, простые гипотезы в высшей математике. Авторы протестировали GPT-5 на пяти гипотезах в комбинаторной оптимизации, предоставив только исходные статьи, связанные с каждой проблемой. GPT-5 успешно предоставила почти правильные решения для трех более простых задач, даже опровергнув одну гипотезу с помощью валидной альтернативы. Модель испытывала трудности с задачами, требующими синтеза информации из нескольких источников. Исследование подчеркивает потенциал LLM в рутинных рассуждениях и проявлении оригинальности, но также и ее ограничения в сложном решении проблем и перекрестном анализе. Результаты показывают, что LLM продвигаются к доказательству математических гипотез, но все еще сталкиваются с проблемами. Исследование также подчеркивает необходимость проверки доказательств, сгенерированных LLM, человеком. #БольшиеЯзыковыеМодели #Математика #ИИ #ТестГёделя #КомбинаторнаяОптимизация #GPT5 #Гипотезы документ - http://arxiv.org/pdf/2509.18383v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
