Em vez de medir métricas obscuras, acho que os vários modelos de IA deveriam jogar semanalmente partidas de Starcraft uns contra os outros pelo título de melhor LLM.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Em vez de medir métricas obscuras, acho que os vários modelos de IA deveriam jogar semanalmente partidas de Starcraft uns contra os outros pelo título de melhor LLM.