2007-09-01

开始学SAS,第一个小程序

forcode:开始学SAS了,刚看了十几页,用的教材是清华大学出版社出版的、阮桂海编著的《SAS统计分析实用大全》,这本书的好处是讲SAS的时候是结合统计原理讲,和郭志刚老师那本SPSS的书是类似的,不过这本书对统计的讲解还是不够深入全面,而且不附带光盘,所有的程序都要自己输入,也不知道结果是否正确。所以打算去借基本有光盘的教材对照着读,找到了这三本,HJT推荐过朱世武老师的《 SAS编程技术与金融数据处理》,可能就借这本吧
SAS for Windows (v8) 统计分析系统教程新编     洪楠, 侯军编著     北京:清华大学出版社:北京交通大学出版社,2004     558页     CNY55.00 (含光盘)     C819/28
SAS应用统计实验     邵建利主编     上海:上海财经大学出版社,2006     180页     CNY19.00 (含光盘)     C819/38
SAS编程技术与金融数据处理     朱世武著     北京:清华大学出版社,2003     21, 491页     CNY52.00 (含光盘)     F830.49/30

下面这个程序是第二章P12页的代码,其中
PLOT EDUC*OCU1=SEX;
这一句没看懂,书上的解释是:以每人的性别为图点,画出其教育年限(纵轴)与职业(横轴)交点图。这什么意思?是不是分性别的教育年限与职业曲线?没弄懂。下面运行出来的结果中也没有这一项。

另外发现,SAS中屏幕中拷贝过来的内容贴到word或者gmail编辑窗口都变形了,各列不能对齐,stata的运行结果也有这个问题,吴晓刚老师教了一招,把字体改成current new就ok了,另外字体可以弄小点,这点经验在sas中也适用。

另外,sas输出的交互表,统计图全是这种文本格式的,非常难看,虽然可以直接用一个记事本容纳所有内容,还是不够美观,不爽,不知道sas更高版本是否有更漂亮的图形。stata可以做出很漂亮的统计图形来,尤其事件史分析中的图形,看起来很专业。

第一个SAS小程序,呵呵:

data older;
input ID1 1-2 CASEID 3-5 NAME 6 SEX AGE 8-9 EDC 10 OCU1 11 OCU2 12 SAL1 13-15 SAL2 16-18 V1 19 V2 20 V3 21 V4 22 V5 23;
LIST;
CARD;
11001116031015012021214
11002116542218018011210
11030227023013012021310
;
PROC PRINT;
TITLE '老龄人社会保障抽样调查';
PROC PLOT;
PLOT EDUC*OCU1=SEX;
PROC CHART;
VBAR OCU1;
HBAR SEX;
PROC FREQ;
TABLES EDC;
TABLES EDC*SAL1;
PROC MEANS;
PROC SORT;
BY SEX EDC;
PROC PRINT;
PROC MEANS;
BY SEX EDC;
Run;

运行结果:


                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007   7

   Obs   ID1   CASEID   NAME   SEX   AGE   EDC   OCU1   OCU2   SAL1   SAL2   V1   V2   V3   V4   V5

    1     11      1       1     1     60    3      1      0     150    120    2    1    2    1    4
    2     11      2       1     1     65    4      2      2     180    180    1    1    2    1    0
    3     11     30       2     2     70    2      3      0     130    120    2    1    3    1    0
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007   8

                            Frequency

                            1 ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              ?      *****       *****       *****
                              妰儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍
                                        1           2           3

                                              OCU1 Midpoint
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007   9

            SEX                                                    Cum.              Cum.
          Midpoint                                           Freq  Freq  Percent  Percent
                  ?
            1.0   ?***************************************     2     2    66.67    66.67
                  ?
            1.5   ?                                            0     2     0.00    66.67
                  ?
            2.0   ?*******************                         1     3    33.33   100.00
                  ?
                  妰儍儍儍儍儍儍儍儍儍垉儍儍儍儍儍儍儍儍儍?
                                      1                   2

                                  Frequency
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007  10

                                          The FREQ Procedure

                                                       Cumulative    Cumulative
                       EDC    Frequency     Percent     Frequency      Percent
                       儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍
                         2           1       33.33             1        33.33
                         3           1       33.33             2        66.67
                         4           1       33.33             3       100.00


                                         Table of EDC by SAL1

                             EDC       SAL1

                             Frequency?
                             Percent  ?
                             Row Pct  ?
                             Col Pct  ?    130?    150?    180? Total
                             儍儍儍儍儓儍儍儍儍垉儍儍儍儓儍儍儍儍?
                                    2 ?     1 ?     0 ?     0 ?     1
                                      ? 33.33 ?  0.00 ?  0.00 ? 33.33
                                      ?100.00 ?  0.00 ?  0.00 ?
                                      ?100.00 ?  0.00 ?  0.00 ?
                             儍儍儍儍儓儍儍儍儍垉儍儍儍儓儍儍儍儍?
                                    3 ?     0 ?     1 ?     0 ?     1
                                      ?  0.00 ? 33.33 ?  0.00 ? 33.33
                                      ?  0.00 ?100.00 ?  0.00 ?
                                      ?  0.00 ?100.00 ?  0.00 ?
                             儍儍儍儍儓儍儍儍儍垉儍儍儍儓儍儍儍儍?
                                    4 ?     0 ?     0 ?     1 ?     1
                                      ?  0.00 ?  0.00 ? 33.33 ? 33.33
                                      ?  0.00 ?  0.00 ?100.00 ?
                                      ?  0.00 ?  0.00 ?100.00 ?
                             儍儍儍儍儓儍儍儍儍垉儍儍儍儓儍儍儍儍?
                             Total           1        1        1        3
                                         33.33     33.33    33.33   100.00
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007  11

                                         The MEANS Procedure

            Variable    N            Mean         Std Dev         Minimum         Maximum
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
            ID1         3      11.0000000               0      11.0000000      11.0000000
            CASEID      3      11.0000000      16.4620776       1.0000000      30.0000000
            NAME        3       1.3333333       0.5773503       1.0000000       2.0000000
            SEX         3       1.3333333       0.5773503       1.0000000       2.0000000
            AGE         3      65.0000000       5.0000000      60.0000000      70.0000000
            EDC         3       3.0000000       1.0000000       2.0000000       4.0000000
            OCU1        3       2.0000000       1.0000000       1.0000000       3.0000000
            OCU2        3       0.6666667       1.1547005               0       2.0000000
            SAL1        3     153.3333333      25.1661148     130.0000000     180.0000000
            SAL2        3     140.0000000      34.6410162     120.0000000     180.0000000
            V1          3       1.6666667       0.5773503       1.0000000       2.0000000
            V2          3       1.0000000               0       1.0000000       1.0000000
            V3          3       2.3333333       0.5773503       2.0000000       3.0000000
            V4          3       1.0000000               0       1.0000000       1.0000000
            V5          3       1.3333333       2.3094011               0       4.0000000
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007  12

   Obs   ID1   CASEID   NAME   SEX   AGE   EDC   OCU1   OCU2   SAL1   SAL2   V1   V2   V3   V4   V5

    1     11      1       1     1     60    3      1      0     150    120    2    1    2    1    4
    2     11      2       1     1     65    4      2      2     180    180    1    1    2    1    0
    3     11     30       2     2     70    2      3      0     130    120    2    1    3    1    0
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007  13

-------------------------------------------- SEX=1 EDC=3 ---------------------------------------------

                                         The MEANS Procedure

            Variable    N            Mean         Std Dev         Minimum         Maximum
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
            ID1         1      11.0000000               .      11.0000000      11.0000000
            CASEID      1       1.0000000               .       1.0000000       1.0000000
            NAME        1       1.0000000               .       1.0000000       1.0000000
            AGE         1      60.0000000               .      60.0000000      60.0000000
            OCU1        1       1.0000000               .       1.0000000       1.0000000
            OCU2        1               0               .               0               0
            SAL1        1     150.0000000               .     150.0000000     150.0000000
            SAL2        1     120.0000000               .     120.0000000     120.0000000
            V1          1       2.0000000               .       2.0000000       2.0000000
            V2          1       1.0000000               .       1.0000000       1.0000000
            V3          1       2.0000000               .       2.0000000       2.0000000
            V4          1       1.0000000               .       1.0000000       1.0000000
            V5          1       4.0000000               .       4.0000000       4.0000000
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?


-------------------------------------------- SEX=1 EDC=4 ---------------------------------------------

            Variable    N            Mean         Std Dev         Minimum         Maximum
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
            ID1         1      11.0000000               .      11.0000000      11.0000000
            CASEID      1       2.0000000               .       2.0000000       2.0000000
            NAME        1       1.0000000               .       1.0000000       1.0000000
            AGE         1      65.0000000               .      65.0000000      65.0000000
            OCU1        1       2.0000000               .       2.0000000       2.0000000
            OCU2        1       2.0000000               .       2.0000000       2.0000000
            SAL1        1     180.0000000               .     180.0000000     180.0000000
            SAL2        1     180.0000000               .     180.0000000     180.0000000
            V1          1       1.0000000               .       1.0000000       1.0000000
            V2          1       1.0000000               .       1.0000000       1.0000000
            V3          1       2.0000000               .       2.0000000       2.0000000
            V4          1       1.0000000               .       1.0000000       1.0000000
            V5          1               0               .               0               0
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?


-------------------------------------------- SEX=2 EDC=2 ---------------------------------------------

            Variable    N            Mean         Std Dev         Minimum         Maximum
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
            ID1         1      11.0000000               .      11.0000000      11.0000000
            CASEID      1      30.0000000               .      30.0000000      30.0000000
            NAME        1       2.0000000               .       2.0000000       2.0000000
            AGE         1      70.0000000               .      70.0000000      70.0000000
            OCU1        1       3.0000000               .       3.0000000       3.0000000
            OCU2        1               0               .               0               0
            SAL1        1     130.0000000               .     130.0000000     130.0000000
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
                                        老龄人社会保障抽样调查   10:58 Thursday, September 1, 2007  14

-------------------------------------------- SEX=2 EDC=2 ---------------------------------------------

                                         The MEANS Procedure

            Variable    N            Mean         Std Dev         Minimum         Maximum
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?
            SAL2        1     120.0000000               .     120.0000000      120.0000000
            V1          1       2.0000000               .       2.0000000       2.0000000
            V2          1       1.0000000               .       1.0000000       1.0000000
            V3          1       3.0000000               .       3.0000000       3.0000000
            V4          1       1.0000000               .       1.0000000       1.0000000
            V5          1               0               .               0               0
            儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍儍?



--
最新奇有趣的新技术、科幻、社会学信息:
奇想录 http://www.qixianglu.cn
订   阅 http://feed.feedsky.com/woodphone
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

没有评论: