<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" 
     xmlns:content="http://purl.org/rss/1.0/modules/content/"
     xmlns:wfw="http://wellformedweb.org/CommentAPI/"
     xmlns:dc="http://purl.org/dc/elements/1.1/"
     xmlns:meneame="http://meneame.net/faq-es.php"
 >
<channel>
	<title>Menéame: comentarios [4077728]</title>
	<link>http://www.meneame.net</link>
	<image><title>www.meneame.net</title><link>http://www.meneame.net</link><url>http://cdn.mnmstatic.net/m/eMnm/img/mnm/eli-rss.png</url></image>
	<description>Sitio colaborativo de publicación y comunicación entre blogs</description>
	<pubDate>Tue, 15 Jul 2025 09:29:29 +0000</pubDate>
	<generator>http://blog.meneame.net/</generator>
	<language>es</language>
	<item>
		<meneame:comment_id>43163414</meneame:comment_id>
		<meneame:link_id>4077728</meneame:link_id>
		<meneame:order>3</meneame:order>
		<meneame:user>--837907--</meneame:user>
		<meneame:votes>0</meneame:votes>
		<meneame:karma>10</meneame:karma>
		<meneame:url>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia</meneame:url>
		<title>#3 Qué pruebas usamos para medir lo &#34;inteligente&#34; que es una IA</title>
		<link>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia/c03#c-3</link>
		<pubDate>Tue, 15 Jul 2025 09:29:29 +0000</pubDate>
		<dc:creator>--837907--</dc:creator>
		<guid>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia/c03#c-3</guid>
		<description><![CDATA[<p>Para mitigar el problema del overfitting los tests de benchmark no dicen qué problemas se acertaron y cuáles no, aunque esto no veo cómo es una solución a largo plazo. También en cada test, el conjunto de problemas es un subconjunto pequeno del total. Esto parece más efectivo pero conlleva el problema de que funciona menos como un benchmark real.<br />
<br />
Supongo que la única solución realmente es ir sacando benchmarks con problemas completamente nuevos y más complejos, pero llegará un punto en que no habrá capacidad humana para poder hacer tests que evalúen bien la generalización. Creo que posiblemente en algún punto los modelos competirán entre sí en el mundo real, en lugar de ser evaluados por tests disenados por humanos.</p><p>&#187;&nbsp;autor: <strong>--837907--</strong></p>]]></description>
	</item>

	<item>
		<meneame:comment_id>43163361</meneame:comment_id>
		<meneame:link_id>4077728</meneame:link_id>
		<meneame:order>2</meneame:order>
		<meneame:user>anv</meneame:user>
		<meneame:votes>1</meneame:votes>
		<meneame:karma>18</meneame:karma>
		<meneame:url>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia</meneame:url>
		<title>#2 Qué pruebas usamos para medir lo &#34;inteligente&#34; que es una IA</title>
		<link>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia/c02#c-2</link>
		<pubDate>Tue, 15 Jul 2025 09:21:48 +0000</pubDate>
		<dc:creator>anv</dc:creator>
		<guid>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia/c02#c-2</guid>
		<description><![CDATA[<p>También se les hace pruebas que requieren razonamiento especialmente pensadas para que no puedan resolverse en base a puro entrenamiento y cada vez responden mejor. Muchas veces superando a los humanos.</p><p>&#187;&nbsp;autor: <strong>anv</strong></p>]]></description>
	</item>

	<item>
		<meneame:comment_id>43163356</meneame:comment_id>
		<meneame:link_id>4077728</meneame:link_id>
		<meneame:order>1</meneame:order>
		<meneame:user>cenutrios_unidos</meneame:user>
		<meneame:votes>0</meneame:votes>
		<meneame:karma>20</meneame:karma>
		<meneame:url>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia</meneame:url>
		<title>#1 Qué pruebas usamos para medir lo &#34;inteligente&#34; que es una IA</title>
		<link>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia/c01#c-1</link>
		<pubDate>Tue, 15 Jul 2025 09:20:56 +0000</pubDate>
		<dc:creator>cenutrios_unidos</dc:creator>
		<guid>https://www.meneame.net/m/eMnm/pruebas-usamos-medir-inteligente-ia/c01#c-1</guid>
		<description><![CDATA[<p>Pones un modelo a dar por culo a otro.</p><p>&#187;&nbsp;autor: <strong>cenutrios_unidos</strong></p>]]></description>
	</item>

</channel>
</rss>
