1 meneos
45 clics
Dynamic Chunking for End-to-End Hierarchical Sequence Modeling
En este trabajo, presentamos una red jerárquica integral (H-Net) que comprime datos sin procesar mediante un proceso recursivo de fragmentación dinámica (DC) dependiente de los datos. Las H-Nets igualan la eficiencia de los pipelines tokenizados, a la vez que mejoran sustancialmente la capacidad de modelado, al reemplazar heurísticas artesanales con segmentación basada en el contenido y el contexto, aprendida a partir de los datos. [EN]
|
comentarios cerrados
Eso pa Trump es poco .. por lo menos 46.