4 tips para manejar grandes archivos de texto

Manejar grandes archivos de texto suele pasar cuando enfrentas un log, registros diarios de operaciones que contienen millones de registros y ya las herramientas de texto (Notepad++) no logran visualizar y/o se vuelven lentas. En este artículo, te presento tips para salir airosos de varias situaciones, también te listo herramientas que pueden ayudarte.

4 tips para manejar archivos de texto muy grandes

Unir grandes archivos de texto en uno solo

Cuando te piden un solo archivo consolidado de varias archivos que no puedes abrir con block de notas ni Notepad++ ni Sublime, es necesario recurrir a otros métodos.

Uno de ellos es realizar dicha unificación a través de comandos DOS. Para ello:

  1. Abrir comando DOS ( Tecla Windows + R y escribir cmd)
  2. Ubicarte en el directorio donde están tus archivos.
  3. Escribir for %f in (*.txt) do type «%f» >> archivofinal.txt
unir archivos muy grandes

Lo que hará el comando es buscar todos los que tengan extensión .txt y consolidará en un solo archivo llamado «Archivofinal.txt»

Tips al consolidar el archivo

  • Valida que los archivos estén bien consolidados. Una de las maneras es contar antes de unir la cantidad de caracteres. Por ejemplo:
    • En el archivo vemos que se duplica la información.
    • La respuesta se debe en el comando, como es mucha la información, en el archivo que se viene generando temporal también tiene extensión .txt, por ello lo toma y duplica.
  • Valida el tamaño de los archivos, el resultante debería ser la suma de los archivos a unir.
consolidar archivos muy grandes en uno solo

La solución en caso se duplique es modificar el comando de 2 formas:

  • Modificar el comando sin la terminación .txt : El comando sería
    for %f in (*.txt) do type «%f» >> archivofinal.tx , al final cambiamos el nombre de archivofinal.tx a archivofinal.txt en caso quisieramos ver como un archivo de texto.
  • Modificar los archivos y comando: Por ejemplo, a todos los archivos terminarán con sufijo «_tdt» ; entonces, el comando deberá ser
    for %f in (*_tdt.txt) do type «%f» >> archivofinal.txt

Buscar contenido dentro del archivo de texto

En los tips señalados líneas arriba, recomendé buscar ciertos caracteres. Para ello te listo los comandos principales que te servirán para navegar en modo básico por el DOS:

  • cd : te permite ir hacia una carpeta. Por ejemplo: cd Documents y presionar Enter
  • dir : te lista todo el contenido de tu carpeta. Por ejemplo: dir y presionar Enter
  • cls: limpia la pantalla del DOS
  • Find: encuentra una cadena de texto en el archivo. Por ejemplo : Find «tdt2019» archivofinal.txt y presionar Enter.
  • Help: te brinda ayuda y documentación. Por ejemplo: help find y presionar Enter

Herramientas que pueden ayudar a manejar grandes archivos de texto

Si aún con los tips listados arriba, no logras realizar la acción que requieres te listo 4 herramientas para gestionar archivos de texto grandes con sus respectivos enlaces:

EmEditor

Una de las herramientas más recomendadas en la web. Tiene versión free y de pago. Soporta hasta 248GB o 2.1 billones de líneas con solo un poco de memoria.

TextPad

Herramienta simple, usada para gestionar sólo archivos de texto. Tiene versión free y de pago. Múltiples archivos pueden ser editados simultáneamente.

EditPad Lite

Usada para gestionar sólo archivos de texto. Soporta tanto para Windows, UNIX y MAc.
Tiene versión free y de pago. Permite realizar backups.

Log Viewer

Rápido scrolling, soporta cualquier tamaño de archivo de 4GB a más. Permite crear comandos de filtrado de log. Tiene versión free y de pago.

Dividir grandes archivos en pequeños archivos en Windows con WinRar y 7zip

Si bien te mostré que podemos consolidar archivos gigantes, aquí te muestro la forma cómo dividir o separar un archivo gigante en más archivos pequeños y después también poder unirlos con WinRar. (Aplica también para 7ZIP)

  1. Ubicar tu archivo, presiona Click Derecho y selecciona «Abrir con Archivo».
  2. Se mostrará una ventana, en la parte izquierda inferior ingresar/seleccionar la cantidad de MB o GB a particionar.
partir varios archivos en windows

El programa calculará y particionará en base a lo descrito. Para volver a juntar es necesario que las partes estén en una sola carpeta y será suficiente con descomprimir uno de ellos. El programa automáticamente consolidará en un solo archivo.

Tips Adicional: Separar grandes archivos de texto en UNIX

Para separa archivos de texto en UNIX puedes utilizar el comando split. El comando es :  split [opción][fichero] [prefijo]

partir varios archivos en unix

El ejemplo mostrado en la siguiente figura corresponde a dividir el archivo en partes de 1 MB (1024KB) por ello la sentencia fue: split -b 1024 prueba_split_teknolosys teknlosys. El resultado fue que el archivo se particionó aplicando como prefijo teknolosys.

Esta práctica lo realizaba cuando necesitaba buscar/ analizar cierto contenido y lo partía el archivo en varias partes (debido que la consulta demoraba), cuando encontraba la información ya lo descargaba en mi directorio local.

Espero que con esos tips puedan ayudarte a manejar este tipo de archivos grandes que ni el Notepad ++ (es la herramienta que uso generalmente y escribí 5 tips para usar Notepad++) pudo ayudarme. En este tiempo de grandes volúmenes de información debemos tener en cuenta estos tips. ¿Conoces algún otro tip que no está en este artículo?

Suscríbete y recibe tips actualizados gratis