分享

Matlab数据可视化(3):一维数据绘图 I

 lynchlynch12 2013-11-15
以下介绍一维数据的可视化。

一. 饼状图、根状图和梯形图

1) 饼状图

(源代码:pie_stem_stairs.m)


饼状图可以直观地表示百分比的相对大小。饼状图可以由matlab的pie命令绘制。其中,我们可以将某些数据从饼中分离以强调显示(图1)。
  1. Expenses = [20 10 40 12 20 19 5 15];  
  2. ExpenseCategories = {'食品','药品','住宿','其他','交通',...  
  3. '水电','礼品','购物'};  
  4. MostLeastExpensive = ...  
  5. (Expenses==max(Expenses)|Expenses==min(Expenses));  
  6.   
  7. figure();  
  8. h=pie(gca,Expenses,MostLeastExpensive,ExpenseCategories);  
  9. % 命令为每一个数据项返回一个文本句柄(text handle,h的偶数项)  
  10. % 可以通过句柄改变字体大小  
  11. for i =2:2:16;set(h(i),'fontsize',14);end  
  12.   
  13. % 添加标注  
  14. title('年度支出报告','fontsize',14);  



图 1

2) 根状图

根状图可由stem命令绘制,根状图常用来表示连续信号的离散采样数据(图2)。
  1. %% 根状图  
  2. figure;  
  3. x = linspace(0,2,100);  
  4. x1 = x(1:13:end);  
  5. x2 = x(1:5:end);  
  6. y = exp(.3*x).*cos(-2*x);  
  7. yy = round(rand(1,length(x1)));yy(yy==0)=-1;  
  8. y1 = exp(.3*x1).*cos(-2*x1)+yy.*rand(1,length(x1));  
  9. yy = round(rand(1,length(x2)));yy(yy==0)=-1;  
  10. y2 = exp(.3*x2).*cos(-2*x2)+yy.*rand(1,length(x2));  
  11. plot(x,y); hold on;  
  12. h1 = stem(x1,y1);  
  13. h2 = stem(x2,y2);  
  14.   
  15. % 设置标志的大小和样式  
  16. set(h1,'MarkerFaceColor','green','Marker','o','Markersize',7,'Color',[0 0 0]);  
  17. set(h2,'MarkerFaceColor','red','Marker','s','Color',[0 0 0]);  
  18. xlabel('x');ylabel('信号');  
  19. title({'以一定的采样率对连续信号进行采样','由于噪声的存在,采样不完美'});  
  20. legend({'原始信号','带噪声离散化1','带噪声离散化2'});  
  21. print(gcf,'-dpng','./stem.png');  



图 2

3) 梯形图

梯形图可由stairs命令得到,它常常用于数据之间连线并无意义的情况下的绘图,在数据密集的情况下,也可以用梯形图代替柱状图。(图3)
  1. %% 梯形图  
  2.   
  3. %figure('units','normalized','position',[0.1 0.1 0.6 0.6]);  
  4. figure;  
  5. % 加载数据  
  6. load algoResultsData.mat  
  7. % 增加一行NaN,以使最梯形图最后是一条水平线(而非上升线)  
  8.   
  9. h=stairs([MethodPerformanceNumbers nan(5,1)]');  
  10. legendMatrix = {'Fresh Tissue','FFPE',...  
  11. 'Blood','DNA','Simulated'};  
  12. for i = 1:5;  
  13. set(h(i),'linewidth',2); % 加粗线条  
  14. % y在图例说明后面加注“共计…个”   
  15. legendMatrix{i} = [legendMatrix{i} ...  
  16.     ', 共计' num2str(CategoryTotals(i)) '个'];  
  17. end  
  18. set(gca,'xlim',[0.5 6.5],...  
  19. 'XTick',1.5:nosOfMethods+1,...  
  20. 'XTickLabel',{'K Means','Fuzzy C Means',...  
  21. 'Hierarchical','Maximize Expectation','Dendogram'});  
  22.   
  23. % 添加标注  
  24. title({'5种聚类算法在','5个测试集上测试结果'},'fontsize',15);  
  25. legendflex(h,... %handle to plot lines  
  26. legendMatrix,... %corresponding legend entries  
  27. 'ref', gcf, ... %which figure  
  28. 'anchor', {'ne','ne'}, ...%location of legend box  
  29. 'buffer',[0 0], ... % an offset wrt the location  
  30. 'fontsize',8,... %font size  
  31. 'xscale',.5); %a scale factor for symbols  
  32. rotateXLabels(gca,20);  
  33. set(gca,'position',[0.1139    0.1989    0.7750    0.6638]);  
  34. set(gcf,'color',[1 1 1],'paperpositionmode','auto');  




图 3

二. 盒形图

(源代码boxplots.m)

盒形图(box plot)又名盒须图(box-and-whisker diagram)。它能在一副图中同时表示多种统计信息。具体而言,包括如下五种统计量:中位数(median,Q2)

上下四分位数(Q1、Q3)和最大最小值。其中,Q1和Q3构成盒子,胡须分别向上和向下延伸到最大值和最小值处。

接下来,我们利用matlab自带的命令plotbox,绘制14种癌症的第105号基因表达水平的盒形图(图4)。

  1. % 加载14种癌症基因表达数据,共16063组基因,144+54=198个样本  
  2. load 14cancer.mat  
  3.   
  4. figure('units','normalized','Position',[0    0    0.8    0.8]);  
  5. data = [Xtrain(:,0105); Xtest(:,0105)];  
  6. labels = [ytrainLabels ytestLabels];  
  7. boxplot(data,labels,'labels',classLabels);  
  8.   
  9. ylabel('基因表达水平','fontsize',12);  
  10. title({'盒状图表示198个样本的基因','在14种癌症上的表达水平'},'fontsize',12);  


图 4

第三方函数aboxplot,提供了更高级的功能,我们可以为盒形图上色,同时绘制多组盒形图等。

首先,绘制单独一组盒形图(图5)。

  1. figure;  
  2. x1 = normrnd(5,2,10000,1); % 期望为5,方差为2的正态分布的10000个数据  
  3. x2 = normrnd(10,2,10000,1); % 期望为10,方差为2的正态分布的10000个数据  
  4. x3 = normrnd(15,2,10000,1); % 期望为15,方差为2的正态分布的10000个数据  
  5.   
  6. x = cat(2,x1,x2,x3); % 将三组数据连接成 10000 x 3 的矩阵  
  7. aboxplot(x,'labels',[5,10,15],'Colorgrad','green_down','OutlierMarker','*','OutlierMarkerSize',1,'WidthE',0.2,'WidthS',0.6); % 利用aboxplot绘图  
  8. xlabel('\mu'); % X轴标签  
  9. title('利用aboxplot,绘制更加精制的盒形图');  
图5

然后,我们绘制含有三组数据的盒形图(图6)。

  1. figure;  
  2. % 第一组标准差都为2  
  3. x1 = normrnd(5,2,10000,1);  
  4. x2 = normrnd(10,2,10000,1);  
  5. x3 = normrnd(15,2,10000,1);  
  6. % 第二组标准差都为4  
  7. y1 = normrnd(5,4,10000,1);  
  8. y2 = normrnd(10,4,10000,1);  
  9. y3 = normrnd(15,4,10000,1);  
  10. % 第三组标准差都为6  
  11. z1 = normrnd(5,6,10000,1);  
  12. z2 = normrnd(10,6,10000,1);  
  13. z3 = normrnd(15,6,10000,1);  
  14.   
  15. % 将每组数据连接成 10000 x 3 的矩阵  
  16. x = cat(2,x1,x2,x3);   
  17. y = cat(2,y1,y2,y3);  
  18. z = cat(2,z1,z2,z3);  
  19.   
  20. % 将三组数据连接成 3 x 10000 x 3 的矩阵  
  21. h = cat(1, reshape(x,[1 size(x)]), reshape(y,[1 size(y)]), reshape(z,[1 size(z)]));  
  22.   
  23. aboxplot(h,'labels',[5,10,15],'colorgrad','orange_down','colorrev',true); % 绘图; 颜色默认为蓝色,这里设为橙色; colorrev默认为false,可以改为默认值观察变化  
  24. xlabel('\mu'); % X轴标签  
  25. legend('\sigma=2','\sigma=4','$\sigma=6'); % 添加图例  
  26. title('同时绘制多组盒形图');  


图 6

三. 迷你图(sparkline)

(源代码:sparklines.m)

sparkline最初是由Edward Tufte(爱德华塔夫特)提出的,是一类信息体积小和数据密度高的图表。目前它被用作一些测量,相关的变化的信息呈现的方式,如平均温度,股市交投活跃。sparkline也常常以一组多条的形式出现在柱状图,折线图当中。

以下我们用迷你图绘制谷歌等7家公司2011年全年的股价信息。(图7)

  1. %% 加载数据  
  2. [dt{1} dateD{1}] = xlsread('AAPL_090784_012412.csv');  
  3. [dt{2} dateD{2}] = xlsread('GOOG_090784_012412.csv');  
  4. [dt{3} dateD{3}] = xlsread('MSFT_090784_012412.csv');  
  5. [dt{4} dateD{4}] = xlsread('SLB_090784_012412.csv');  
  6. [dt{5} dateD{5}] = xlsread('YHOO_090784_012412.csv');  
  7. [dt{6} dateD{6}] = xlsread('S&P_090784_012412.csv');  
  8. [dt{7} dateD{7}] = xlsread('GE_090784_012412.csv');  
  9. stocks = {'AAPL','GOOG','MSFT','SLB','YHOO','S&P','GE'};  
  10. rangeMIN = datenum('1/1/2011');  
  11. rangeMAX = datenum('12/31/2011');  
  12.   
  13. %% 数据预处理  
  14. for i = 1:length(dt)      
  15.     % 数据处理  
  16.     % 将日期转化为数字形式  
  17.     dateD{i} = datenum({dateD{i}{2:end,1}});  
  18.     % 查找日期区间  
  19.     idx = find(dateD{i} >= rangeMIN & dateD{i} <= rangeMAX);  
  20.     dt{i} = dt{i}(idx);   
  21.     % 提取区间内的数据  
  22.     dateD{i} = dateD{i}(idx);  
  23.     % 标准化数据  
  24.     dtn{i} = dt{i}./max(dt{i});  
  25.     clear idx  
  26.     labels2{i} = num2str(dt{i}(end));      
  27. end  
  28.   
  29. %% 绘制迷你图  
  30. sparkline(dateD,dtn,stocks,labels2);  


图7

实际的绘制工作由sparkline命令完成,方法是将7条表示股价信息的曲线绘制在同一个figure中,高度分别相关若干距离。代码如下:

  1. function sparkline(xdata,ydata,labels1,labels2)  
  2.   
  3. %SPARKLINE(XDATA,YDATA,LABELS1,LABELS2) creates a graph with sparklines  
  4. % XDATA and YDATA are cell arrays of vectors of x and corresponding y  
  5. % values. LABELS1 give the labels you want corresponding to each sparkline  
  6. % to be located at the start of the line. LABELS2 give the labels you want   
  7. % corresponding to each sparkline to be located at the end of the line.   
  8.   
  9. % No borders necessary - span the axes out to total available space  
  10. % make the plots by bumping up each sparkline with an arbitrary unit of  
  11. % separation. Here unitOfSep=1;  
  12. unitOfSep=1;  
  13.   
  14. figure; axes('position',[0 0 1 .9]);hold on;  
  15. endPt = -1;  
  16. startPt = 1e100;  
  17. for i = 1:length(xdata)  
  18.     % Plot SparkLines  
  19.     plot(xdata{i}, ydata{i}+ (i-1)*+unitOfSep,'k');   
  20.       
  21.     maxp{i} = find(ydata{i}==max(ydata{i}));   
  22.     minp{i} = find(ydata{i}==min(ydata{i}));  
  23.   
  24.     plot(xdata{i}(maxp{i}),ydata{i}(maxp{i})+ (i-1)*+unitOfSep,'bo','MarkerFaceColor','b');  
  25.     plot(xdata{i}(minp{i}),ydata{i}(minp{i})+ (i-1)*+unitOfSep,'ro','MarkerFaceColor','r');  
  26.     text(xdata{i}(end), mean(ydata{i})+ (i-1)*+unitOfSep,labels1{i},'HorizontalAlignment','right');  
  27.     text(xdata{i}(1), mean(ydata{i})+ (i-1)*+unitOfSep,labels2{i},'HorizontalAlignment','left');  
  28.       
  29.     endPt = max([xdata{i}(1) endPt]);  
  30.     startPt= min([xdata{i}(end) startPt]);  
  31. end  
  32. text(startPt+50, i*unitOfSep+.7,'1/1/2011 到 12/31/2011股价迷你图','fontsize',14);  
  33. set(gca,'visible','off','ylim',[0+unitOfSep/2 i*unitOfSep+unitOfSep/2],...  
  34.     'yticklabel',[],'xlim',[startPt-.15*(endPt-startPt) endPt+.15*(endPt-startPt)],...  
  35.     'xticklabel',[],'TickLength',[0 0]);  
  36. set(gcf,'Color',[1 1 1],'Paperpositionmode','auto');  

四. 堆叠折线图(stacked line graph)

(源代码:stackedlines.m)

堆叠折线图可以表示多组数据变化趋势。以下我们利用绘制面积图的area命令制作堆叠折线图。我们已有15个名字的受欢迎程度在各个年份的排名,我们即要用图像表示出这个趋势。(图8)

  1. %% 加载数据  
  2. [ranksoverdecades names] = xlsread('MockDataNameVoyager.xlsx');  
  3. sex = names(2:end,2);  
  4. names = names(2:end,1);  
  5. years = ranksoverdecades(1,:);  
  6. ranksoverdecades = ranksoverdecades(2:end,:);  
  7. ranksoverdecades = ranksoverdecades';  
  8. % 将男孩名字和女孩名字分开  
  9. males = find(strcmp(sex,'M'));  
  10. fmales = find(strcmp(sex,'F'));  
  11. ymax=max(max(cumsum(ranksoverdecades,2)));  
  12.   
  13. % 计算名字标签的位置的y坐标  
  14. nameLoc = cumsum(ranksoverdecades(end,:));  
  15. nameLoc = [0 nameLoc];  
  16. nameLoc = (nameLoc(1:end-1) + nameLoc(2:end))/2;  
  17.   
  18. %% 布局  
  19. figure('units','normalized','Position',[ 0.3432    0.1472    0.6542    0.7574]);  
  20. % 创建主坐标轴  
  21. axes('position',[.05,.1,.87,.85],'ylim',[0 ymax],'xlim',[min(years) max(years)],'YAxisLocation','right',...  
  22.     'ytick',nameLoc,'yticklabel',names,'ticklength',[0.01 0.05],'tickdir','out','fontsize',14);  
  23. % 另建一个坐标轴,绘制面积图  
  24. axes('Position',get(gca,'Position'));  
  25. % 绘制拆线  
  26. h = area(years,ranksoverdecades);  
  27. % 按性别设定颜色,男孩为蓝色,女孩为粉色  
  28. set(h(males),'FaceColor',[100   149 237]/255)  
  29. set(h(fmales),'FaceColor',[255  192 203]/255);  
  30. % fix edgecolor and x and y limits  
  31. set(h,'edgecolor',[.5 .5 .5]) % Set all to same value  
  32. set(gca,'ylim',[0 ymax],'xlim',[min(years) max(years)],'xticklabel',[],'fontsize',14);  
  33. box on;  
  34. % annotate the graph  
  35. title('婴儿名字趋势图','Fontsize',14);  
  36. ylabel('排名随年份的变化','Fontsize',14);  
  37. text(mean(get(gca,'xlim')),-11,'年份','Fontsize',14);  
图 8

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多