NaN'ler içinde Pandalar Dataframe birleştirme sonuçları

oy
-1

Her iki dataframes de float64 bir sütun üzerinde iki dataframes birleştirme ediyorum. Oysa Oluşan dataframe iki dataframes birinden gelen tüm sütunlar için NaN'ler sahiptir birleşti.

İşte birleştirme geçerli:

merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')

İki dataframes ilişkin İşte info

news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id    float64
news_id     object
label       bool
title       object
source      object
text        object
dtypes: bool(1), float64(1), object(4)


tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0                  int64
index                    int64
tweet_id                 float64
tweet                    object
user_screen_name         object
user_id                  object
user_location            object
user_verified            bool
user_friends_count       int64
user_followers_count     int64
user_listed_count        int64
user_statuses_count      int64
user_favourites_count    int64
dtypes: bool(1), float64(1), int64(7), object(4)

Neyi kaçırıyorum?

Oluştur 03/12/2019 saat 00:00
kaynak kullanıcı
Diğer dillerde...                            


1 cevaplar

NaN'ler içinde Pandalar Dataframe birleştirme sonuçları

oy
-1

Her iki dataframes de float64 bir sütun üzerinde iki dataframes birleştirme ediyorum. Oysa Oluşan dataframe iki dataframes birinden gelen tüm sütunlar için NaN'ler sahiptir birleşti.

İşte birleştirme geçerli:

merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')

İki dataframes ilişkin İşte info

news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id    float64
news_id     object
label       bool
title       object
source      object
text        object
dtypes: bool(1), float64(1), object(4)


tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0                  int64
index                    int64
tweet_id                 float64
tweet                    object
user_screen_name         object
user_id                  object
user_location            object
user_verified            bool
user_friends_count       int64
user_followers_count     int64
user_listed_count        int64
user_statuses_count      int64
user_favourites_count    int64
dtypes: bool(1), float64(1), int64(7), object(4)

Neyi kaçırıyorum?

Cevap 03/12/2019 saat 00:00
kaynak kullanıcı

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more