7/ データ型
関西大学総合情報学部
以下のデータ型はRが提供しているデータ型の一部(太字は本講義で紹介するデータ型)
class()関数を使用
TRUEとFALSEのみで構成されるデータ型
logi_vec1のデータ型の確認is.logical()で確認可能。
()内のオブジェクトがlogical型ならTRUE、それ以外はFALSEが返ってくる。c()を使用
TRUEとFALSEは"で囲んではいけない(character型として認識される)。[]内に直接打ち込んでも良い"で囲まれているデータ型
c()を使用[1] "Kansai" "Kwansei-gakuin" "Doshisha" "Ritsumeikan"
char_vec1のデータ型の確認is.character()で確認可能。
()内のオブジェクトがlogical型ならTRUE、それ以外はFALSEが返ってくる。length(): ベクトルの長さnchar(): 各要素の文字数paste(): 文字列の結合
paste0()にすると、結合時、スペースが入らない。列名の下が<chr>ならcharacter型、<fct>ならfactor型
大学名がcharacter型の場合
# A tibble: 4 × 2
大学名 学生数
<chr> <dbl>
1 Ritsumeikan 32467
2 Kwansei-gakuin 23671
3 Kansai 27736
4 Doshisha 25974
大学名がfactor型の場合
# A tibble: 4 × 2
大学名 学生数
<fct> <dbl>
1 Ritsumeikan 32467
2 Kwansei-gakuin 23671
3 Kansai 27736
4 Doshisha 25974
行のソートについてはデータ・ハンドリングの講義にて解説
大学名がcharacter型の場合
# A tibble: 4 × 2
大学名 学生数
<chr> <dbl>
1 Doshisha 25974
2 Kansai 27736
3 Kwansei-gakuin 23671
4 Ritsumeikan 32467
大学名がfactor型の場合
# A tibble: 4 × 2
大学名 学生数
<fct> <dbl>
1 Kansai 27736
2 Kwansei-gakuin 23671
3 Doshisha 25974
4 Ritsumeikan 32467
作図については可視化の講義にて解説
大学名がcharacter型の場合

大学名がfactor型の場合

[1] "Ritsumeikan" "Kwansei-gakuin" "Kansai" "Doshisha"
[1] "character"
sort()関数を使用factor()関数でfactor化
levels引数に順番を指定すること[1] Ritsumeikan Kwansei-gakuin Kansai Doshisha
Levels: Kansai Kwansei-gakuin Doshisha Ritsumeikan
[1] "factor"
factor()内にlevelsとlabelsを両方指定する(Charactrer型のfactor化はlevelsのみで十分)。| 値 | 意味 | 例 |
|---|---|---|
NA |
何らかの値があるはずだが、欠損している状態 | |
NULL |
そもそも存在しない | |
NaN |
計算不可 | 0 / 0 |
Inf |
無限大 | 10 / 0 |
初心者レベルでNULLを使うことはないが、中級以上からは(そこそこ)使う機会がある。

mean()関数でVec2の平均値を計算してみよう。?meanを入力し、mean()関数の詳細について調べてみると、mean()関数で使用可能な引数の一覧が表示される。na.rm a logical value indicating whether NA values should be stripped before
the computation proceeds.
na.rmはlogical型の値であり、計算の前に欠損値(NA)を除去するか否かを示す引数である。」my_vec5の5番目の要素として、0を追加my_vec5の6、7、8番目の要素として、-1、-2、-3を追加my_vec5の11番目に10を入れたら?my_vec5の要素の中から0より小さい要素に-1を掛けて置換する。