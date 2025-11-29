Más allá del contenido, los archivos que creamos o vemos en nuestro ordenador contienen información conocida como metadatos. En este post veremos cómo ver y editar metadatos en Ubuntu.

La función de los metadatos es describir, organizar y dar contexto a u n archivo para que sea más fácil de entender, buscar, clasificar y analizar.

Para qué sirven los metadatos

Funciones de los metadatos

Organización: Los metadatos facilitan el ordenamiento de gran cantidad de información.

Comprensión: Ayudan a que sistemas automáticos como modelos de Inteligencia Artificial, buscadores o bibliotecas entiendan mejor el contenido

Tipos de metadatos

Podemos dividirlos en tres clases:

Descriptivos: Datos que identifican al documento como Título, autor, descripción y palabras claves.

Administrativos: Permisos, fecha de creación, tamaño, formato.

Cómo ver y editar los metadatos en Ubuntu

Existen varias herramientas gráficas para editar los metadatos, pero en este post solo vamos a concentrarnos en las que usan la terminal.

PDF

Los documentos en formatos PDF tienen los siguientes formatos:

Título.

Autor.

Tema.

Palabras clave.

Fecha de creación

Fecha de modificación.

Motor de generación.

Software utilizado para la creación.

Protecciones y permisos.

Existe otro formato llamado XMP que incluye además esta información:

Información de derechos de autor.

Miniaturas.

Idiomas del documento.

Etiquetas personalizadas.

Hay dos comandos útiles para ver los metadatos en Ubuntu:

Pdfinfo

Se instala con:

sudo apt install poppler-utils

Uso:

pdfinfo nombre_archivo.pdf

Ejemplo del comando PDFINFO

Exiftool

Con esta herramienta podemos ver los metadatos en formato XMP.

Se instala con:



sudo apt install libimage-exiftool-perl

Uso

exiftool nombre_archivo.pdf

Ejemplo de uso del programa Exiftool

Para editar un metadato usamos el comando

exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf

En nuestro ejemplo, si queremos traducir el título:



exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf

El comando Exiftool puede cambiar metadatos

Podemos borrar todos los metadatos con:

exiftool -all= nombre_archivo.pdf

Por si nos arrepentimos del borrado, el comando crea una copia del archivo PDF al que le agrega la aclaración de original al nombre.

Docx

El formato nativo de Word incluye metadatos del documento y metadatos de la aplicación.

Los metadatos del documento son:

Título.

Autor.

Última persona que lo modificó.

Número de revisiones.

Fecha de creación.

Fecha de última modificación.T

Tema.

Palabra clave.

Categoría.

Estado (Borrador, final.

Metadatos de la aplicación

Plantilla

Software utilizado.

Total de páginas.

Número de palabras.

Número de caracteres.

Cantidad de líneas.

Cantidad de párrafos.

Configuración de escalado.

Organización.

Nombre del responsable del equipo.

Exiftool

El comando Exiftool también sirve para ver los metadatos de un documento de Word.

Uso

exiftool nombre_archivo.docx

El comando exiftool también sirve para ver metadats de un documento de Word.

Otra forma de ver los metadatos es cambiando la extención de archivos al formato zip. Por razones de seguridad vamos a hacerlo con una copia.



cp nombre_archivo.docx copia_archivo.zip

Descomprimimos el archivo y abrimos la carpeta que necesitamos



unzip copia_archivo.zip -d docxinfo

Leemos los datos de los archivos

cat docxinfo/docProps/core.xml

Para los metadatos del documento

cat docxinfo/docProps/apdp.xml

Para los metadatos de la aplicación

cat docxinfo/docProps/app.xml

Tanto usando exiftool como manualmente podemos edital los metadatos. De nuevo, el procedimiento con exiftool es igual a que como hicimos en el caso de los pdf.

exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx

Podemos hacer lo mismo manualmente de la siguiente manera:

Hacemos una copia de seguridad

cp nombre_archivo.docx copia_archivo.zip

Descomprimimos en una carpeta llamada metadatos.

unzip copia_archivo.zip -d metadatos

Vamos a la carpeta

cd metadatos

Abrimos el editor



nano docProps/core.xml para los metadatos del documento

nano docProps/apdp.xml para los metadatos de la aplicación

Volvemos a empaquetar el archivo como docx