Uzyskaj liczbę kolumn w R DataFrame

Uzyskaj Liczbe Kolumn W R Dataframe



W R pobieranie liczby kolumn jest podstawową operacją wymaganą w wielu sytuacjach podczas pracy z DataFrame. Podczas dzielenia na podzbiory, analizowania, manipulowania, publikowania i wizualizacji danych liczba kolumn jest kluczową informacją, którą należy znać. W związku z tym R zapewnia różne podejścia do uzyskiwania sumy kolumn określonej DataFrame. W tym artykule omówimy niektóre podejścia, które pomagają nam uzyskać liczbę kolumn DataFrame.

Przykład 1: Użycie funkcji Ncol().

ncol() jest najczęstszą funkcją do uzyskiwania sumy kolumn ramek danych.







df <- data.ramka('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Liczba kolumn w ramce danych :', n)

W tym przykładzie najpierw tworzymy ramkę danych „df” z trzema kolumnami oznaczonymi jako „y1”, „y2” i „y3” za pomocą funkcji data.frame() w R. Elementy w każdej kolumnie są określone za pomocą funkcja c(), która tworzy wektor elementów. Następnie, używając zmiennej „n”, funkcja ncol() jest używana do określenia sumy kolumn w DataFrame „df”. Wreszcie, z komunikatem opisowym i zmienną „n”, podana funkcja cat() wyświetla wyniki na konsoli.



Zgodnie z oczekiwaniami pobrane dane wyjściowe wskazują, że określona ramka DataFrame ma trzy kolumny:







Przykład 2: policz łączną liczbę kolumn dla pustej ramki danych

Następnie stosujemy funkcję ncol() do pustej ramki DataFrame, która również pobiera wartości wszystkich kolumn, ale ta wartość wynosi zero.

pusty_df <- dane.ramka()

n <- ncol(pusty_df)

cat('---Kolumny w ramce danych :', n)

W tym przykładzie generujemy pustą ramkę DataFrame „empty_df”, wywołując metodę data.frame() bez określania kolumn lub wierszy. Następnie używamy funkcji ncol(), która służy do znalezienia liczby kolumn w DataFrame. Funkcja ncol() jest tutaj ustawiona z ramką danych „empty_df”, aby uzyskać sumę kolumn. Ponieważ ramka danych „empty_df” jest pusta, nie ma żadnych kolumn. Tak więc wyjście ncol(empty_df) to 0. Wyniki są wyświetlane przez funkcję cat(), która jest tutaj wdrożona.



Dane wyjściowe pokazują wartość „0” zgodnie z oczekiwaniami, ponieważ DataFrame jest pusta.

Przykład 3: Użycie funkcji Select_If() z funkcją Length().

Jeśli chcemy pobrać liczbę kolumn dowolnego typu, powinniśmy użyć funkcji select_if() w połączeniu z funkcją length() R. Używane są te funkcje, które są łączone w celu uzyskania sumy kolumn każdego typu . Kod do korzystania z tych funkcji jest zaimplementowany w następujący sposób:

biblioteka (dplyr)

x1<-LITERY[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-próbka(c('Lato','Zima'),10,replace=PRAWDA)

df1<-data.frame(x1,x2,x3,x4)

df1

długość(select_if(df1,is.numeric))

W tym przykładzie najpierw ładujemy pakiet dplyr, abyśmy mogli uzyskać dostęp do funkcji select_if() i length() . Następnie tworzymy cztery zmienne – odpowiednio „x1”, „x2”, „x3” i „x4”. Tutaj „x1” zawiera 10 pierwszych wielkich liter alfabetu angielskiego. Zmienne „x2” i „x3” są generowane przy użyciu funkcji rpois() w celu utworzenia dwóch oddzielnych wektorów po 10 liczb losowych o parametrach odpowiednio 2 i 5. Zmienna „x4” jest wektorem czynników z 10 elementami losowo próbkowanymi z wektora c („Lato”, „Zima”).

Następnie próbujemy utworzyć DataFrame „df1”, w której wszystkie zmienne są przekazywane w funkcji data.frame(). Na koniec wywołujemy funkcję length() w celu określenia długości ramki danych „df1” utworzonej za pomocą funkcji select_if() z pakietu dplyr. Funkcja select_if() wybiera jako argument kolumny z ramki danych „df1”, a funkcja is.numeric() wybiera tylko kolumny zawierające wartości liczbowe. Następnie funkcja length() pobiera sumę kolumn wybranych przez select_if(), która jest wynikiem całego kodu.

Długość kolumny jest pokazana w następujących danych wyjściowych, które wskazują całkowitą liczbę kolumn DataFrame:

Przykład 4: Użycie funkcji Sapply().

I odwrotnie, jeśli chcemy tylko policzyć brakujące wartości w kolumnach, mamy funkcję sapply(). Funkcja sapply() iteruje po każdej kolumnie DataFrame, aby działać w określony sposób. Funkcja sapply() jest najpierw przekazywana z DataFrame jako argumentem. Następnie wymaga wykonania operacji na tej ramce DataFrame. Implementacja funkcji sapply() w celu uzyskania liczby wartości NA w kolumnach DataFrame jest następująca:

nowy_df <- data.ramka(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(nowy_df, funkcja(x) sum(jest.na(x)))

W tym przykładzie generujemy ramkę danych „new_df” z trzema kolumnami — „c1”, „c2” i „c3”. Pierwsze kolumny, „c1” i „c3”, zawierają wartości liczbowe, w tym niektóre brakujące wartości, które są reprezentowane przez NA. Druga kolumna, „c2”, zawiera znaki, w tym niektóre brakujące wartości, które również są reprezentowane przez NA. Następnie stosujemy funkcję sapply() do ramki danych „new_df” i obliczamy liczbę brakujących wartości w każdej kolumnie za pomocą wyrażenia sum() wewnątrz funkcji sapply().

Funkcja is.na() to wyrażenie, które jest określone dla funkcji sum(), która zwraca wektor logiczny wskazujący, czy brakuje każdego elementu w kolumnie, czy nie. Funkcja sum() sumuje wartości PRAWDA, aby policzyć brakujące wartości w każdej kolumnie.

W związku z tym dane wyjściowe wyświetlają całkowite wartości NA w każdej z kolumn:

Przykład 5: Użycie funkcji Dim().

Dodatkowo chcemy uzyskać sumę kolumn wraz z wierszami DataFrame. Następnie funkcja dim() podaje wymiary DataFrame. Funkcja dim() przyjmuje obiekt jako argument, którego wymiary chcemy pobrać. Oto kod do użycia funkcji dim():

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

punkty=c(8, 10, 7, 4))

przyćmiony (d1)

W tym przykładzie najpierw zdefiniujemy ramkę DataFrame „d1”, która jest generowana za pomocą funkcji data.frame(), w której dwie kolumny są ustawione jako „zespół” i „punkty”. Następnie wywołujemy funkcję dim() w DataFrame „d1”. Funkcja dim() zwraca liczbę wierszy i kolumn DataFrame. Dlatego, gdy uruchomimy dim(d1), zwraca wektor z dwoma elementami – z których pierwszy odzwierciedla liczbę wierszy w DataFrame „d1”, a drugi reprezentuje liczbę kolumn.

Dane wyjściowe reprezentują wymiary DataFrame, gdzie wartość „4” oznacza łączną liczbę kolumn, a wartość „2” reprezentuje wiersze:

Wniosek

Teraz dowiedzieliśmy się, że zliczanie liczby kolumn w R jest prostą i ważną operacją, którą można wykonać na DataFrame. Spośród wszystkich funkcji ncol() jest najwygodniejszym sposobem. Teraz znamy różne sposoby uzyskiwania liczby kolumn z danej DataFrame.