Skip to content

Instantly share code, notes, and snippets.

@eduardoromero
Last active April 11, 2025 15:06
Show Gist options
  • Save eduardoromero/8495437 to your computer and use it in GitHub Desktop.
Save eduardoromero/8495437 to your computer and use it in GitHub Desktop.
Tratando de separar nombres y apellidos de un campo. Se separa el nombre completo por palabras, se procesa cada palabra, si es una palabra que forma parte de un nombre o apellido compuesto se guarda para anexarla hasta el siguiente ciclo. Al final se tiene que tomar una decisión sobre que hacer para separar los nombres si son más de dos. Si son …
<?php
/* separar el nombre completo en espacios */
$tokens = explode(' ', trim($full_name));
/* arreglo donde se guardan las "palabras" del nombre */
$names = array();
/* palabras de apellidos (y nombres) compuetos */
$special_tokens = array('da', 'de', 'del', 'la', 'las', 'los', 'mac', 'mc', 'van', 'von', 'y', 'i', 'san', 'santa');
$prev = "";
foreach($tokens as $token) {
$_token = strtolower($token);
if(in_array($_token, $special_tokens)) {
$prev .= "$token ";
} else {
$names[] = $prev. $token;
$prev = "";
}
}
$num_nombres = count($names);
$nombres = $apellidos = "";
switch ($num_nombres) {
case 0:
$nombres = '';
break;
case 1:
$nombres = $names[0];
break;
case 2:
$nombres = $names[0];
$apellidos = $names[1];
break;
case 3:
$apellidos = $names[0] . ' ' . $names[1];
$nombres = $names[2];
default:
$apellidos = $names[0] . ' '. $names[1];
unset($names[0]);
unset($names[1]);
$nombres = implode(' ', $names);
break;
}
$nombres = mb_convert_case($nombres, MB_CASE_TITLE, 'UTF-8');
$apellidos = mb_convert_case($apellidos, MB_CASE_TITLE, 'UTF-8');
@henryossa
Copy link

Hola, he intentado modificar la función para Apps Script, ya que debo obtener por separado nombres y apellidos, algo como nombre1, nombre2, apellido1 y apellido2, pero no lo logro. Alguno ha implementado esta modificación de la función? o, alguien puede, por favor, ayudarme con esto?

@yayoscar
Copy link

aqui dejo una versión para python si contaramos con la CURP

import unicodedata

# Tokens compuestos comunes en nombres y apellidos
SPECIAL_TOKENS = {'da', 'de', 'del', 'la', 'las', 'los', 'mac', 'mc', 'van', 'von', 'y', 'i', 'san', 'santa'}

def normalizar(texto):
    return unicodedata.normalize('NFKD', texto).encode('ASCII', 'ignore').decode().upper()

def es_vocal(letra):
    return letra in "AEIOU"

def obtener_vocal_interna(nombre):
    for c in nombre[1:]:
        if es_vocal(c):
            return c
    return 'X'

def extraer_datos_desde_curp(curp):
    curp = curp.upper()
    return {
        'letra_apellido_paterno': curp[0],
        'vocal_interna_apellido_paterno': curp[1],
        'letra_apellido_materno': curp[2],
        'letra_nombre': curp[3],
    }

def separar_nombre_completo(nombre_completo: str, curp: str = None):
    tokens = nombre_completo.strip().split()
    tokens = [normalizar(t) for t in tokens]
    palabras = []

    # Une tokens compuestos
    prev = ""
    for token in tokens:
        if token.lower() in SPECIAL_TOKENS:
            prev += token + " "
        else:
            palabras.append((prev + token).strip())
            prev = ""

    # Inicializa variables
    apellido_paterno = apellido_materno = nombre = ""
    total = len(palabras)

    if total >= 3:
        apellido_paterno = palabras[0]
        apellido_materno = palabras[1]
        nombre = ' '.join(palabras[2:])
    elif total == 2:
        apellido_paterno = palabras[0]
        nombre = palabras[1]
    elif total == 1:
        nombre = palabras[0]

    # Validación con CURP
    if curp:
        curp_val = extraer_datos_desde_curp(curp)

        if apellido_paterno:
            if normalizar(apellido_paterno)[0] != curp_val['letra_apellido_paterno'] or \
               obtener_vocal_interna(normalizar(apellido_paterno)) != curp_val['vocal_interna_apellido_paterno']:
                print("⚠️ Advertencia: El apellido paterno no coincide con la CURP.")

        if apellido_materno and normalizar(apellido_materno)[0] != curp_val['letra_apellido_materno']:
            print("⚠️ Advertencia: El apellido materno no coincide con la CURP.")

        if nombre and normalizar(nombre)[0] != curp_val['letra_nombre']:
            print("⚠️ Advertencia: El nombre no coincide con la CURP.")

    return {
        'apellido_paterno': apellido_paterno.title(),
        'apellido_materno': apellido_materno.title(),
        'nombre': nombre.title()
    }

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment