Importar datos de la web a Excel es una necesidad en muchos casos, como por ejemplo recuperar información departamental. pero usa la técnica de copiar y pegar es la peor!!! La forma más sencilla y limpia es hacer la importación con la herramienta Power Query. He aquí cómo hacerlo.
¿Qué es la consulta de energía?
Power Query es la herramienta moderna de importación y transformación de datos. Es muy sencillo de utilizar y no requiere conocimientos avanzados de Excel ni conocimientos de programación.
Si quieres aprender a usar Power Query, lo he diseñado para ti esta formación en Udemy muy fácil acceso.

Página de Wikipedia de los departamentos franceses
Como suele ocurrir, la fuente de información más utilizada es Wikipedia. Y aquí solo vamos a cargar la página de Wikipedia de los departamentos franceses.

Y en esta página encontramos la tabla de departamentos con números.

PERO CUIDADO ! Sobre todo NO copiar pegar de la tabla en Excel. Recuperar datos copiando y pegando desde la web requerirá mucho trabajo de formateo.
Por otro lado, siguiendo los siguientes pasos verás que importar datos es muy fácil con Power Query. Esta herramienta está integrada en Excel desde la versión 2016.
Importar datos web a Excel
Gracias a Power Query, es extremadamente fácil recuperar datos de un sitio web. Solo ve al menú Datos > Desde la web

Y allí solo tendrás que pegar la dirección (URL) de la página web en la ventana que se acaba de mostrar.

Después de unos segundos, aparece la siguiente ventana y no parece una página web en absoluto???????¿Pero cuál es esta información?

En fait, son simplemente todas las tablas que están presentes en esta página. Y si el sitio está bien construido (como suele ser el caso de Wikipedia), es fácil encontrar el título de la tabla que nos interesa.
De hecho, el título de la sección corresponde al título de la tabla.

Entonces, solo necesitamos seleccionar esta tabla de la lista de tablas del documento.

Pero estos datos deben manipularse un poco antes de importarlos a Excel. Por eso vamos a hacer clic en el botón. Transformar datos.

Transformar datos
En la página de Wikipedia aparece mucha información para un solo departamento (número, nombre, capital, fecha de creación, densidad, etc.). Sólo queremos conservar el número y el nombre. Así es como lo vamos a hacer.
Paso 1: mantenga las primeras 2 columnas
El primer paso, muy sencillo, consistirá en conservar sólo las 2 primeras columnas.
- Seleccione las 2 primeras columnas con la tecla Control para realizar una selección múltiple.
- Haga clic derecho en los encabezados de las columnas.
- Elige una opción Eliminar otras columnas

Paso 2: elimina las primeras 3 líneas
Luego, las primeras 3 líneas son las muchas líneas del encabezado de la tabla de la página web. No necesitamos conservarlos.
- Ir a la pestaña Inicio
- Selecciona el menu Eliminar líneas
- Después Eliminar filas superiores

El resultado es el siguiente

Paso 3: limpiar los nombres de los departamentos
Entonces, los datos son casi perfectos pero hay que eliminar los datos que están entre paréntesis. Pero también podemos ver que hay un salto de línea después del nombre de cada departamento. Es este personaje especial que nos ayudará.
Separaremos la columna del nombre del departamento en 2 columnas según el carácter de nueva línea
- Haga clic derecho en el encabezado de la columna
- Menú columna dividida
- Submenú Por delimitadores...

Luego, en el cuadro de diálogo que aparece
- Seleccionar opción personnalisé para elegir tu delimitador
- Abre el menu Opciones avanzadas
- Luego marca la casilla Dividir usando caracteres especiales
- Luego seleccione Insertar un carácter especial
- Finalmente elige la opción Retorno de carro y avance de línea

Con esta manipulación, insertamos automáticamente el código para separar en el carácter de nueva línea (es demasiado fácil con Power Query) ????

Y el resultado es este.

Paso 4: eliminar la columna agregada
Por supuesto, hemos aislado los nombres de los departamentos. Pero también agregamos una columna adicional que debemos eliminar. El procedimiento es muy simple
- Haga clic derecho en el encabezado de la columna para eliminar
- Eliminar columna

Paso 5: cerrar y cargar
Ya solo queda transferir estos datos a una hoja de Excel haciendo clic en el menú Inicio > Cerrar y Cargar

Resultado en Excel
¡Y AHÍ VAS! En tan solo unos pasos hemos recuperado los departamentos con sus números de la página web de Wikipedia ????

Código de importación completo
Aquí está el código completo para importar desde el sitio de Wikipedia.
let
Source = Web.Page(Web.Contents("https://fr.wikipedia.org/wiki/Liste_des_d%C3%A9partements_fran%C3%A7ais")),
Data1 = Source{1}[Data],
#"Premières lignes supprimées" = Table.Skip(Data1,2),
#"En-têtes promus" = Table.PromoteHeaders(#"Premières lignes supprimées", [PromoteAllScalars=true]),
#"Autres colonnes supprimées" = Table.SelectColumns(#"En-têtes promus",{"Code", "Nom"}),
#"Dernières lignes supprimées" = Table.RemoveLastN(#"Autres colonnes supprimées",3),
#"Fractionner la colonne par délimiteur" = Table.SplitColumn(#"Dernières lignes supprimées", "Nom", Splitter.SplitTextByDelimiter("#(cr)#(lf)", QuoteStyle.Csv), {"Département Nom.1", "Département Nom.2"}),
#"Colonnes supprimées" = Table.RemoveColumns(#"Fractionner la colonne par délimiteur",{"Département Nom.2"}),
#"Colonnes renommées" = Table.RenameColumns(#"Colonnes supprimées",{{"Département Nom.1", "Département Nom"}}),
#"Texte nettoyé" = Table.TransformColumns(#"Colonnes renommées",{{"Département Nom", Text.Clean, type text}}),
#"Espaces supprimés" = Table.TransformColumns(#"Texte nettoyé",{{"Département Nom", Text.Trim, type text}})
in
#"Espaces supprimés"
Descarga de archivos
Encontrarás todos los departamentos con sus números. en este archivo
29/11/2024 a las 19:11
Cómo extraer datos DHIS de Power query
usando la función de la web
29/11/2024 a las 20:54
¿Qué es DHIS?