Reproduire les résultats de pd.merge en SQL ?

voix
18

J'ai joué avec certains ensembles de données en Python et j'essaie maintenant de reproduire les mêmes résultats dans un environnement en nuage avec SQL

J'ai 3 tables, chacune avec plusieurs doublons. Par exemple, la table A contiendra les a, b, c, d, ...ID, la table B contiendra les ID a, c, e, a1, a2 ...et la table C contiendra les ID d, f, a2, b1, b2, ...

Je suis en train de faire pd.mergepour les tableaux A et B sur l'identificationa, et le tableau C avec le tableau résultant de la première fusion sur l'identificationa2. En utilisant pd.merge, j'ai remarqué que cela ajouterait un _xou un _yaux ID en double (c'est-à-dire que dans la première pd.mergedes tables A et B, cla table A deviendrait c_x, et cla table B deviendrait c_yet ainsi de suite pour tous les autres ID en double. La même chose s'appliquerait à tout autre double d'identification pour toute jointure

Comment pourrais-je reproduire ce processus et contourner le problème des doublons d'ID en SQL ?

Créé 26/05/2020 à 03:30
source utilisateur
Dans d'autres langues...                            


1 réponses

voix
0

Je pense que vous pouvez renommer dans la jointure le reste des colonnes jointes avec de nouveaux noms :

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

J'espère que vous trouverez cela utile.

Créé 10/06/2020 à 15:51
source utilisateur

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more