Last active
April 11, 2025 15:06
-
-
Save eduardoromero/8495437 to your computer and use it in GitHub Desktop.
Tratando de separar nombres y apellidos de un campo. Se separa el nombre completo por palabras, se procesa cada palabra, si es una palabra que forma parte de un nombre o apellido compuesto se guarda para anexarla hasta el siguiente ciclo. Al final se tiene que tomar una decisión sobre que hacer para separar los nombres si son más de dos. Si son …
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
<?php | |
/* separar el nombre completo en espacios */ | |
$tokens = explode(' ', trim($full_name)); | |
/* arreglo donde se guardan las "palabras" del nombre */ | |
$names = array(); | |
/* palabras de apellidos (y nombres) compuetos */ | |
$special_tokens = array('da', 'de', 'del', 'la', 'las', 'los', 'mac', 'mc', 'van', 'von', 'y', 'i', 'san', 'santa'); | |
$prev = ""; | |
foreach($tokens as $token) { | |
$_token = strtolower($token); | |
if(in_array($_token, $special_tokens)) { | |
$prev .= "$token "; | |
} else { | |
$names[] = $prev. $token; | |
$prev = ""; | |
} | |
} | |
$num_nombres = count($names); | |
$nombres = $apellidos = ""; | |
switch ($num_nombres) { | |
case 0: | |
$nombres = ''; | |
break; | |
case 1: | |
$nombres = $names[0]; | |
break; | |
case 2: | |
$nombres = $names[0]; | |
$apellidos = $names[1]; | |
break; | |
case 3: | |
$apellidos = $names[0] . ' ' . $names[1]; | |
$nombres = $names[2]; | |
default: | |
$apellidos = $names[0] . ' '. $names[1]; | |
unset($names[0]); | |
unset($names[1]); | |
$nombres = implode(' ', $names); | |
break; | |
} | |
$nombres = mb_convert_case($nombres, MB_CASE_TITLE, 'UTF-8'); | |
$apellidos = mb_convert_case($apellidos, MB_CASE_TITLE, 'UTF-8'); |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
aqui dejo una versión para python si contaramos con la CURP