Archivos duplicados, cómo encontrarlos y eliminarlos en Ubuntu

En el siguiente artículo vamos a echar un vistazo a tres herramientas para encontrar y eliminar archivos duplicados en Ubuntu. Puede que en más de una ocasión te encuentres con que tu equipo está lleno de archivos duplicados. Un día descubres que tu disco duro está lleno de múltiples copias de los mismos archivos en diferentes directorios de respaldo. El problema viene por que es habitual olvidarse de limpiar estos archivos y el disco duro comienza a acumular demasiados archivos duplicados después de un cierto período de tiempo.

Es por esto que siempre es bueno saber cómo encontrar y eliminar archivos duplicados. Para hacerlo, podemos utilizar las herramientas que se detallan a continuación en los sistemas operativos tipo Unix. Hay que tener cuidado al eliminar los archivos duplicados. Si no lo tienes, te puede llevar a la pérdida accidental de datos. Por eso, es aconsejable prestar atención al usar estas herramientas.

Buscar y eliminar archivos duplicados en Ubuntu

Para esta tarea que nos ocupa, veremos tres herramientas disponibles; Rdfind, Fdupes, Fslint.

Estas tres utilidades son gratuitas, de código abierto y funcionan en la mayoría de los sistemas operativos tipo Unix.

Rdfind

Rdfind es una utilidad de código abierto y gratuita para encontrar archivos duplicados en directorios y subdirectorios.

Compara los archivos en función de su contenido, no de sus nombres de archivo. Rdfind utiliza el algoritmo de clasificación para diferenciar entre archivos originales y duplicados. Si encuentra dos o más archivos iguales, Rdfind es lo suficientemente inteligente como para encontrar cuál es el archivo original. Una vez que encuentre los duplicados, nos informará de ellos. Podremos decidir eliminarlos o reemplazarlos.

Instalación de Rdfind

Abrimos una terminal (Ctrl+Alt+T) y escribimos:

sudo apt install rdfind

Uso

Una vez instalado, simplemente hay que ejecutar el comando Rdfind junto con la ruta dónde queremos buscar los archivos duplicados.

rdfind ~/Descargas/

Como puede ver en la captura de pantalla anterior, el comando Rdfind escaneará el directorio ~/Descargas. Guardará los resultados en un archivo llamado results.txt, situado en el directorio de trabajo actual. Se puede ver el nombre de los posibles archivos duplicados dentro del archivo results.txt.

Se puede obtener más información sobre todas las posibilidades que ofrece, mediante la sección de ayuda o las páginas man:

rdfind --help

man rdfind

Fdupes

Fdupes es otra utilidad de línea de comandos para identificar y eliminar los archivos duplicados dentro de los directorios y subdirectorios especificados. Es una utilidad gratuita de código abierto escrita en lenguaje de programación C.

Fdupes identifica los duplicados comparando tamaños de archivo, firmas MD5 parciales, firmas MD5 completas y finalmente realizando una comparación de byte a byte para la verificación.

Es similar a la utilidad Rdfind, pero Fdupes viene con bastantes opciones para realizar operaciones, tales como:

  • Buscar recursivamente archivos duplicados en directorios y subdirectorios.
  • Excluir archivos vacíos y archivos ocultos de consideración.
  • Mostrar el tamaño de los duplicados.
  • Y muchas más.

Instalación de Fdupes

Abrimos una terminal (Ctrl+Alt+T) y escribimos:

sudo apt install fdupes

Uso

El uso de Fdupes es bastante simple. Solo hay que ejecutar el siguiente comando para encontrar los archivos duplicados en un directorio, por ejemplo ~/Descargas.

fdupes ~/Descargas

También podremos buscar archivos duplicados de los subdirectorios, simplemente usando la opción -r.

Para eliminar todos los duplicados, la opción a utilizar será -d.

fdupes -d ~/Descargas

Este comando nos permitirá seleccionar para preservar el original y eliminar todos los demás archivos duplicados. Aquí hay que andarse con cuidado. Fácilmente podemos eliminar archivos originales si no tenemos cuidado.

Para obtener más información sobre cómo utilizar fdupes, consulta la sección de ayuda o las páginas man:

fdupes –help

man fdupes

FSlint

FSlint es otra utilidad para buscar archivos duplicados que encontré en Github. A diferencia de las otras dos utilidades, FSlint tiene ambos modos, GUI y CLI. Por lo tanto, es una herramienta más fácil de usar.

FSlint no solo encuentra los duplicados, sino también los enlaces simbólicos, nombres incorrectos, archivos temporales, IDS incorrectos, directorios vacíos y binarios no eliminados, etc.

Instalación de Fslint

Abrimos una terminal (Ctrl+Alt+T) y escribimos:

sudo apt install fslint

Uso

Una vez que esté instalado, podremos ejecutarlo desde el menú de aplicaciones.

Como puede ver, la interfaz de FSlint es fácil de usar y se explica por sí misma. En la pestaña Ruta de búsqueda, agregaremos la ruta que queremos escanear. Solo tendremos que hacer clic en el botón Buscar para buscar los duplicados. Verifica la opción “¿Recursivo?” para buscar recursivamente duplicados en directorios y subdirectorios. FSlint escaneará rápidamente el directorio dado y los enumerará.

De la lista, elije los duplicados que quieres limpiar. Podrás trabajar con cualquiera de ellos con acciones como Guardar, Eliminar, Fusionar y Enlace simbólico. En la pestaña Parámetros de búsqueda avanzada, se pueden especificar las rutas a excluir mientras se buscan duplicados.

Para obtener más detalles sobre FSlint, consulta la sección de ayuda y las páginas man.

/usr/share/fslint/fslint/fslint --help

man fslint

Estas son solo tres herramientas eficaces para buscar y eliminar archivos duplicados no deseados en Gnu/Linux.

Comparte para difundir

Si te ha gustado nuestro contenido ahora puedes ayudar a difundirlo en las redes sociales de manera sencilla usando los siguientes botones:

Envía
Pinea
Print

Categorías

Ubuntu

Aficionado a la programación y al software. Dispuesto a aprender de todo para después contarlo.

2 comentarios

  1.   Miguelcm dijo

    Quizá te falto mencionar duff. Gracias.

  2.   Lucio Chávez dijo

    Muy buen aporte! muchas gracias!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.