Categorías
hoy aprendí ...

… a ordenar archivos en carpetas según el patrón de nombre

Descargando un montón de referencias desde Instagram usando esta maravillosa extensión, Instagram Download Button, me llené de archivos JPG y MP4 y se hacía necesario ordenarlos en carpetas.

El patrón es que todos los archivos tienen en la primer parte del nombre la perfil de Instagram y luego la fecha y hora original del posteo seguidos de un choclazo de números, así que tendría que ser «relativamente» sencillo poder encarpetarlos identificando el perfil.

nombre_perfil-YYYYMMDD_HHMMSS-XXXXXXXXX….. [jpg|mp4]

Buscando en encontré varias propuestas aproximadas para hacer algo como lo que quería

Y la opción ganadora

Extract part of a file name in bash

Específicamente esta respuesta que utiliza el comando SED. La única condición es que la primera parte no sean numeros.

El escenario

I have a folder with lots of files having a pattern, which is some string followed by a date and time:

BOS_CRM_SUS_20130101_10-00-10.csv (3 strings before date)
SEL_DMD_20141224_10-00-11.csv (2 strings before date)
SEL_DMD_SOUS_20141224_10-00-10.csv (3 strings before date)

I want to loop through the folder and extract only the part before the date and output into a file.

Output
BOS_CRM_SUS_
SEL_DMD_
SEL_DMD_SOUS_

La propuesta

Assuming you wont have numbers in the first part, you could use:

$ for i in *csv;do  str=$(echo $i|sed -r 's/[0-9]+.*//'); echo $str; done
BOS_CRM_SUS_
SEL_DMD_
SEL_DMD_SOUS_

Prueba

Cuando hice la prueba, solo mostrando el resultado del SED, funcionaba casi como lo deseaba, con el único tema que era que procesaba algunos archivos con otros patrón de nombre (que no eran necesarios) y los que si debía procesar dejaba el guión del medio.

Ejemplo:

almendromaestro-20220602_195749-285312905_1062446314350240_327302066906487345_n.jpeg

> almendromaestro-

Mi modificación a la RegExp

Agregar un guión que aparece antes de la regla para la fecha, así sólo busca los archivos que se aproximan al patrón.

sed -r 's/-[0-9]+.*//'

y pasó el testeo!

Script terminado

Básicamente hace un loop en todos los archivos que haya en la carpeta, separa el nombre y la almacena en STR (y lo mostramos para ir viendo el progreso), usa eso para verificar que si no existe una carpeta la crea, y luego mueve el archivo a la carpeta.

#!/bin/sh

for i in *.*
do
  str=$(echo $i|sed -r 's/-[0-9]+.*//'); 
  echo $str;
  if [ ! -d $str ]; then
      mkdir $str
  fi
  mv $i $str
done

Y chau!

Categorías
hoy aprendí ...

… a tener que escribir todo, incluso lo que ya sabía

Por que por más buena memoria que uno cree tener, a medida que el disco rígido se llena, cada vez es un esfuerzo mayúsculo tener que rememorar. Y a hacer limpieza!

Categorías
hoy aprendí ...

… a reparar unos errores en GIT al hacer push

Quise realizar un push a un repositorio remoto y me soltó un error que nunca había visto:

remote: error: refs/tags/v2.0 does not point to a valid object!

Pensé que se trataba de algún archivo en el disco remoto que se había corrompido, pero cuando hice la prueba con otro repositorio obtuve un error similar (lo trato más abajo).

Lo que pude averiguar es que la referencia del tag v2.0 no apuntaba bien. La solución no está confirmada pero hice:

  • prune en el repo remoto
  • gc tambien en el remoto, aunque me soltaba un error también relacionado con el tag v2.0
  • desde el repo local borré el tag remoto
  • hice un prune y gc (me dio error)
  • luego el push del tag local al repo remoto y funcionó.

En el caso del otro repositorio el problema eran ramas y no etiquera, y varias.

Aquí lo que me funcionó fue: en el repo remoto editar el archivo packed-refs y eliminar las referencias de las ramas indicada, correr un prune y luego en un gc. En el repo local facer un prune y un fetch. Y funcionó.

No estoy totalmente seguro pero hay pasos que me parece que no hace falta.

Chau.

Categorías
hoy aprendí ...

… a recuperar mis escritorios en W10 y darle una patada al Task View

Resulta que a pesar de tener que trabajar en Windows 10 había logrado organizar el tema de los múltiples escritorios para ayudarme a focalizar el trabajo según el tema con la ayuda de Windows 10 Virtual Desktop Enhancer, una aplicación que le agregaba mejoras a los paupérrimos escritorios virtuales (virtual desktops) que traía el sistema operativo ¡en pleno 2019! Nada de fondos personalizados o la posibilidad de darles nombres. Había que recurrir a soluciones de terceros.

El W10VDH ya no tenía soporte ni desarrollo desde fines del 2018 pero funcionaba muy bien hasta hace poco, cuando hubo una actualización de Windows que de repente había habilitado el Task View, Historial, Cortana, y otras «mejoras» más. Pasó que de repente cuando cambiaba de escritorio no me cambiaba el fondo, ni me mostraba el nombre, y al hacer WIN+TAB para tener la vista general de las ventana, me habían cambiado todo de lugar, y aparecía lo de la actividad reciente con el Historial. WTF!

La solución que encontré para poder trabajar como venía haciendo fue:

  1. Encontrar un fork más actualizado del Windows 10 Virtual Desktop Enhacer: https://github.com/vlwkaos/win10-virtual-desktop-enhancer
  2. Descargar el repositorio y ubicar los nuevos scripts en la carpeta donde tenía corriendo el ejecutable original del Windows 10 Virtual Desktop Enhacer.
  3. Desactivar la tecla TaskView de la barra, Cortana, y el Historial.
Categorías
hoy aprendí ...

… a bajar videos de IG

Tengo algunos videos guardados de artistas marciales en una colección de Instagram que quería usar como referencia para un proyecto de historieta que estoy realizando. Ante la dificulta de poner pausa y avanzar/retrocedes cuadro a cuadro en las partes que me interesaba analizar me puse a investigar la forma de bajar los videos.

Me encuentro que existen servicios web que se encargan de hacerlo pero la verdad es que prefiero no usarlos y además tienen la restricción de que el video tiene que ser de un posteo público.

En otros sitios más tech (dev.to, stackoverflow)comentan que se puede por medio de inspeccionar el código fuente y buscar la URL del MP4. El problema era que esas recomendaciones eran de hace unos años y hoy (2021) no funcionan de manera tan directa, ya que las URL del elemento <video> apunta a un CDN con un una URL blob y chorizo de parámetros. Incluso hay uno que opta por utilizar el VLC para descargar el streaming del video.

La pista que daban los sitios tech era ir a INSTAGRAM al posteo del video por navegador web y ver en el panel de DEV del navegador (F12) la solapa RED (NETWORK) los peticiones y respuestas del servidor filtrando por la extensión mp4.

Al momento de recargar la página para ver las peticiones empiezan a aparecer muchas peticiones mp4, correspondientes a las diferentes resoluciones disponibles de video (aunque sólo se carga una) y también las correspondientes al audio por separado (si es que hubiera, como en la mayoría de los videos).

Hice la prueba de copiar la URL de uno de los MP4 y pegarla para que el navegador empezara a cargar algo pero inmediatamente aparecía un error «No se encontró el video con formato y tipo MIME soportados». ¡Qué desilusión! Pero testarudo de mi me puse a tratar de entender los parámetros de la URL:

(la siguiente URL la he editado con XXXXX para preservar la privacidad del video)

instagram.feze12-1.fna.fbcdn.net/v/t50.2886-16/XXXXXXXXX_XXXXXXXXXXXXXXX_XXXXXXXXXXXXXXXXXXX_n.mp4?_nc_ht=instagram.feze12-1.fna.fbcdn.net&_nc_cat=111&_nc_ohc=lhApsAN-thMAX91AbD7&edm=AABBvjUBAAAA&ccb=7-4&oh=af57857dbcb53d99d00d05bcc6dac772&oe=60C76940&_nc_sid=83d603&bytestart=1562297&byteend=1602089

Me puse a probar eliminar algunos y empecé por el final, ya que eran los únicos que tenían algún significado concreto: byteStart y byteEnd, y ¡oh sorpresa!… ¡Funcionó!

EL ASUNTO pasa por copiar alguna de esas URL en una nueva pestaña y borrar los 2 últimos parámetros: &bytestart=XXXXXX&byteend=XXXXXXX

Las XXXXX son unos números de timing que pueden ser cualquier cosa y no afectan.

El navegador empieza entonces la carga del video (o audio) y entonces uno puede hacer «Archivo > Guardar» y descargar el video completo.

OTRO ASUNTO: no hay ninguna pista (o por lo menos no la descubrí) de cual URL en el panel de RED corresponde a qué resolución de video, o si corresponde al audio, así que toca probar.

Recomendaciones:

  • tener el panel de desarrollador abierto en la solapa RED.
  • tener sólo cargado el posteo del video (ir al link específico)
  • detener el video inmediatamente de la carga, porque con cada loop, el panel de RED empieza a llenar nuevas URL de peticiones.

Y chau!

Nota mental: esto da para hacer un user script de navegador con un botón.


Actualización 21:01

Era lógico que alguien ya lo había hecho a ese user script: https://greasyfork.org/es/scripts/406535-instagram-download-button

Gracias!