Prover Agent: An Agent-based Framework for Formal Mathematical Proofs
В данной статье представлен Prover Agent, новый AI-агент, разработанный для автоматизированного доказательства теорем. Он сочетает в себе большие языковые модели (LLM) с системой формального доказательства Lean. Фреймворк Prover Agent координирует LLM для неформального рассуждения, модель формального доказательства и обратную связь от Lean. Он генерирует вспомогательные леммы для облегчения обнаружения стратегий доказательства. Агент достигает высокой успешности на бенчмарке MiniF2F, превосходя другие методы, использующие небольшие языковые модели (SLM), с меньшим бюджетом выборки. Исследование подчеркивает эффективность агента и его способность решать сложные задачи посредством генерации лемм. Основные вклады включают координацию неформальных и формальных рассуждений с обратной связью от Lean, генерацию вспомогательных лемм и передовую производительность доказательства теорем. Подход демонстрирует значительный прогресс в преодолении разрыва между неформальными рассуждениями и формальным доказательством. #доказательствотеорем #AIагент #формальныеметоды #Lean #LLM #автоматизация #математика документ - https://arxiv.org/pdf/2506.19923v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
В данной статье представлен Prover Agent, новый AI-агент, разработанный для автоматизированного доказательства теорем. Он сочетает в себе большие языковые модели (LLM) с системой формального доказательства Lean. Фреймворк Prover Agent координирует LLM для неформального рассуждения, модель формального доказательства и обратную связь от Lean. Он генерирует вспомогательные леммы для облегчения обнаружения стратегий доказательства. Агент достигает высокой успешности на бенчмарке MiniF2F, превосходя другие методы, использующие небольшие языковые модели (SLM), с меньшим бюджетом выборки. Исследование подчеркивает эффективность агента и его способность решать сложные задачи посредством генерации лемм. Основные вклады включают координацию неформальных и формальных рассуждений с обратной связью от Lean, генерацию вспомогательных лемм и передовую производительность доказательства теорем. Подход демонстрирует значительный прогресс в преодолении разрыва между неформальными рассуждениями и формальным доказательством. #доказательствотеорем #AIагент #формальныеметоды #Lean #LLM #автоматизация #математика документ - https://arxiv.org/pdf/2506.19923v1 подписаться - https://t.me/arxivdotorg отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM