Добавить
Уведомления

VCBench: Benchmarking LLMs in Venture Capital

VCBench: Оценка больших языковых моделей в венчурном капитале В документе представлен VCBench, новый бенчмарк для прогнозирования успеха основателей в сфере венчурного капитала (VC). Он решает проблему отсутствия стандартизированных наборов данных для оценки экспертного прогнозирования в VC, где решения основываются на редких и неопределенных сигналах. VCBench предоставляет 9 000 анонимизированных профилей основателей, стандартизированных для предотвращения утечки личных данных при сохранении прогностических характеристик. Бенчмарк оценивает девять современных больших языковых моделей (LLM), некоторые из которых превосходят человеческие показатели. VCBench также включает в себя состязательные тесты, чтобы убедиться, что модели не могут повторно идентифицировать основателей. Ресурс призван установить общепринятый стандарт для воспроизводимой и сохраняющей конфиденциальность оценки AGI на ранних стадиях прогнозирования венчурных инвестиций. VCBench обеспечивает сопоставимость моделей и определяет базовые показатели, соответствующие человеческому уровню. #VCBench #ВенчурныйКапитал #LLM #Бенчмарк #AGI #УспехОснователя #АнонимизацияДанных документ - http://arxiv.org/pdf/2509.14448v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

Иконка канала Paper debate
1 подписчик
12+
6 просмотров
2 месяца назад
20 сентября 2025 г.
12+
6 просмотров
2 месяца назад
20 сентября 2025 г.

VCBench: Оценка больших языковых моделей в венчурном капитале В документе представлен VCBench, новый бенчмарк для прогнозирования успеха основателей в сфере венчурного капитала (VC). Он решает проблему отсутствия стандартизированных наборов данных для оценки экспертного прогнозирования в VC, где решения основываются на редких и неопределенных сигналах. VCBench предоставляет 9 000 анонимизированных профилей основателей, стандартизированных для предотвращения утечки личных данных при сохранении прогностических характеристик. Бенчмарк оценивает девять современных больших языковых моделей (LLM), некоторые из которых превосходят человеческие показатели. VCBench также включает в себя состязательные тесты, чтобы убедиться, что модели не могут повторно идентифицировать основателей. Ресурс призван установить общепринятый стандарт для воспроизводимой и сохраняющей конфиденциальность оценки AGI на ранних стадиях прогнозирования венчурных инвестиций. VCBench обеспечивает сопоставимость моделей и определяет базовые показатели, соответствующие человеческому уровню. #VCBench #ВенчурныйКапитал #LLM #Бенчмарк #AGI #УспехОснователя #АнонимизацияДанных документ - http://arxiv.org/pdf/2509.14448v1 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM

, чтобы оставлять комментарии