jueves, 19 de marzo de 2020

Leer UUID de XML en listado de archivos con Python

Hola bienvenidos a un nuevo post, esta semana quiero compartirles un ejemplo de un programa en Python 2.7 que me ayudo a poder leer el nodo UUID de mis recibos de nómina, se preguntaran para que, bueno ya esta próximo el mes de abril que es el mes de declaración anual para personas físicas en México y me gusta ir preparando mi información para cuando llega el momento, bueno entonces busque el listado de los UUID.


La lógica de mi programa es:


  • Primero obtener la ruta de donde voy a buscar los archivos XML (mis recibos) en mi caso puse la ruta, pero también pueden utilizar el comando raw_input. En el programa la línea:       path = 'c:\\Users\\Ana   \\Documents\\2020\\declaracion\\XML_nominas\\' 
  • De esa carpeta solo buscar archivos con extensión XML
    1. Primero para recorrer el directorio con el os.walk que nos regresa 3 lista, primero el directorio, luego los subdirectorios, los archivos, esto en el programa es for r,d,files in os.walk(path):
    2. Después buscar solo los archivos con extensión o terminación .XML en el programa if file.endswith(".xml"):
  • Después buscar en nodo tfd:TimbreFiscalDigital, para ello primero es necesario :
    1. hacer un parse a los datos del archivo : xmL = pulldom.parse(file)
    2. Luego buscar en los nodos del XML  for event, element in xmL:                if event == pulldom.START_ELEMENT and element.tagName == 'tfd:TimbreFiscalDigital' :
  • Luego encontrar la característica UUID , almacenarla en una variable e imprimirla en el programa son las siguientes lineas  UUID = element.getAttribute('UUID')                   print ("UUID",UUID)
  • Utilice la librería os para leer mi path, para el caso de rutas en Windows deben colocar "//" doble diagonal entre cada directorio, si fuera Linux o Unix solo un "\" 
  • Para colocar comentarios en Python utilicen el caracter "#"
  • Para imprimir la información, utilicen print

Para ello el programa es:


import os
from xml.dom import pulldom

path = 'c:\\Users\\Ana\\Documents\\2020\\declaracion\\XML_nominas\\' 
#path = raw_input("Enter the path:")

files = []
for r,d,files in os.walk(path):
    for file in files:
        if file.endswith(".xml"):
            print(file) 
            xmL = pulldom.parse(file)
            for event, element in xmL:
                if event == pulldom.START_ELEMENT and element.tagName == 'tfd:TimbreFiscalDigital' :
                   UUID = element.getAttribute('UUID')
                   print ("UUID",UUID)


Ejecución del programa



No es un software de contabilidad, pero es un ejemplo de como podemos utilizar Python para nuestra declaración anual. 

Ustedes pueden ajustar el programa para que lea otros nodos y que les de más información si la necesitan.  Espero les sea de utilidad y recuerden si son personas físicas y el año pasado tuvieron facturas por gastos médicos (psicólogo, nutriólogo, dentista,lentes), colegiaturas (hasta preparatoria) , transporte de sus hijos, gastos funerarios, donaciones, hipotecarios, que son los que recuerdo pueden presentar su declaración ante el SAT para más información, les comparto la liga del SAT


No olviden compartirnos, nos leemos en el próximo post, buena semana.                          

No hay comentarios.:

Publicar un comentario