授業内容
base00には、サンプルナンバー、身長、体重、足のサイズ、週の出席数、小遣い、サンプル名(文字データ)、性別(文字データ)、コンピューター暦月数、ワープロ利用の有無(有りなら1、無しは2のデータになっています:以下同様)、表計算ツール利用の有無、メールツール利用の有無、についての12個の質問についてのデータが載っています(2000年版)。
base01Aは、サンプルナンバー、身長、体重、足のサイズ、週の出席数、小遣いについての2001年版のデータです。
base01Bは、追加分のデータで、サンプルナンバー、身長、体重、足のサイズ、週の出席数、小遣いについてのデータです。
base01Cは、サンプルナンバー、サンプル名(文字データ)、性別(文字データ)、コンピューター暦月数、ワープロ利用の有無、表計算ツール利用の有無、メールツール利用の有無についてのデータです。
ステップ2.ワープロ、表計算、メールについて、まったく経験の無い人、一つは経験のある人、2つの経験がある人、3つとも経験がある人の4つを判断するための変数KEIKENを作る。データが入っていないサンプルは取り除いてよい。
ステップ3.コンピュータの利用暦、ワープロ、表計算、メールの経験についての要約統計量を計算。→第8回以降を参照
ステップ4.性別でソートをかけて、性別ごとの身長、体重、足のサイズの要約統計量を計算。不明Nの場合は取り除く。
ステップ5.男性と女性に分けて、週の出席数とお小遣いとの相関を取る。不明Nの場合は取り除く。→第11回以降を参照
ステップ6.男性と女性に分けて身長と、体重と、足のサイズの相関を取る。不明Nの場合は取り除く。
ステップ7.全サンプルについて身長と体重をグラフ化。性別に分けて散布図を作る。プログラムは次のとおりです。
【新規プログラム】
〜読み込みは省略〜
goptions hsize = 25cm<-ここは
注 意 vsize = 18cm;
proc gplot ;
plot hght * wght = sex ;
symbol1 c = red v = # ;
symbol2 c = blue v = % ;
run ;
【プログラム末尾】
ステップ2については、加点要素(出来ない人は飛ばしてもいいけど、付けたらプラスαだ)にしておきます。ステップ4から7は、全部、別プログラムでもOK。