Clasificación de Noticias con Modelos Transformer (AG News)

Este proyecto desarrolla y evalúa un sistema de clasificación automática de noticias utilizando el conjunto de datos AG News.
Se realiza el ajuste de tres modelos de lenguaje basados en transformadores — RoBERTa, DeBERTa y ModernBERT — con el objetivo de categorizar noticias en cuatro temas: Mundo, Deportes, Negocios y Ciencia/Tecnología.
El propósito es comparar su desempeño y analizar cómo la arquitectura y la comprensión contextual de cada modelo influyen en la precisión de la clasificación.

Como tarea adicional (Bonus Task), se amplía el sistema para clasificar noticias reales de RPP, comparando los resultados de los modelos entrenados con las clasificaciones generadas por un modelo de lenguaje de gran escala (LLM).
Esta comparación permite explorar el grado de coincidencia y las diferencias entre los transformadores ajustados y un LLM al aplicarse a contenido local y de dominio específico.

El proyecto tambien esta conectado con otro repositorio llamdo news-query_RPP-lab , que integra recuperación de texto, embeddings y categorización, además, busca comprender cómo funcionan los modelos de lenguaje, cómo pueden entrenarse o ajustarse (fine-tuning) para tareas específicas y de qué manera se puede mejorar su precisión al aplicar técnicas de evaluación y comparación entre diferentes arquitecturas.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
data		data
notebook		notebook
.DS_Store		.DS_Store
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Clasificación de Noticias con Modelos Transformer (AG News)

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Clasificación de Noticias con Modelos Transformer (AG News)

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages