数据库管理系统、数据结构【字数:2500】
数据库管理系统是一种统一管理数据的专门软件系统。数据库是有组织的大量的共享的、长期存储在计算机中的数据集合。 数据的管理经历了三个阶段,最早的是人工管理阶段。人工管理数据有四个特点:(1)数据不保存。因为当时的计算机主要用于科学计算,还没有普及大众。(2)应用程序管理数据,应用程序由使用数据者自己设计,包括数据的逻辑结构、存储结构等。(3)数据不共享。因为数据是面向应用程序的。(4)数据不具有独立性。当数据的逻辑结构发生变化时,对应的程序也需要修改。其次是文件系统阶段。不仅因为磁盘等硬件性能的提升,还因为有了专门管理数据的软件。文件系统管理数据有以下特点:(1)数据的保存时间可以很长。因为计算机在数据处理方面更加频繁,数据需要保存,方便进行反复的查询、修改。(2)由文件系统管理数据。程序和数据之间有特定的转换方式,使得应用程序和数据之间不像人工管理阶段那样密不可分,具有一定的独立性。文件系统减少了维护程序所需要的程序量,大大降低了运营成本。 文件系统也存在以下缺点:(1)数据共享性差。因为文件依旧是面向应用的。(2)数据独立性差。因为文件系统中的数据是为某一个特定应用服务的,如果对当前数据添加新的应用会很复杂。系统很难扩充。现在是数据库系统阶段。随着对象规模的越来越大,计算机控制和管理数据量也越来越大,以往的管理系统已经不能满足时代的要求。数据库系统的特点:(1)数据结构化。数据结构化是数据库系统与文件系统的本质区别。数据结构化意思是,数据是面向整个系统,数据之间是有联系的。(2)数据之间的共享性高。由于数据是面向整个组织,是结构化的,不仅可以共享,还使得数据库系统易于扩充。满足不同用户的要求。(3)数据独立性高。(4)数据库管理系统统一控制和管理数据。 最常用的数据模型。目前最常用的逻辑数据模型有:1.层次模型2.网状模型3.关系模型4.面向对象模型5.对象关系模型 关系模型是目前最重要的数据模型,关系模型中数据的逻辑结构是一张二维表。关系数据库系统采用关系模型作为数据的组织方式。关系数据模型是建立在严格的数学概念之上的。在关系型数据库中,需要掌握的有,关系数据库的基本概念,SQL的数据定义、数据查询、数据更新、数据控制等功能。 通过学习JDBC(Java Data Base Connectivity)可以连接数据库,用Java对数据库进行操作。
1、 Python
在交互式模式下使用命令和脚本方式使用命令。数字类型,字符串,列表以及修改列表值。字典,for循环,while循环,函数。用Python爬取网页只需要三行代码。
2、 R语言
R语言在统计计算和统计制图方面的表现是非常优秀的。R语言的使用主要是借助种类繁多的包。学习R语言,首先下载适合自己电脑的R版本,然后安装,安装成功。R包现目前已经有4600多个,适用于很多方面,例如人工智能,科学计算,人口统计等。选择你要安装的包。包安装完成后,如果要使用包的功能,必须先把包加载到内存中,加载包命令:Library("包名") ,Require("包名")。R不是编译语言,而是解释型语言,也就是说,输入的命令能够被直接执行,不需要像C、C++要首先构成一个完整的程序形式。R对字母的大小写非常敏感,例如A和a就表示两个完全不同的对象。R对象的类别。向量(Vector)。这里的向量的含义与数学里面的向量有所区别,与物理里面的向量也有差别。在R里,就是一个存放数据的地方,类似一维数组和链表。数组是一个K维的数据表。矩阵(matrix)是数组的一个特例。数组或者矩阵中的所有元素都必须是同一种类型的。因子(facter)是一个分类变量,数据框(Dataframes)是由一个或几个向量和因子构成,可以是不同数据类型,但它们必须是等长的。在文件中读写数据。使用geiwd()来找到目录,使用命令setwd()来改变目录。如果一个文件不在工作目录则必须给出文件的路径。举例导入SAS数据。SAS程序:Procexportdata=mydataoutfile=madata.csvdbms=csv;run;R程序:mydata<-read.table(mydata.csv,header=TRUE,SEP=,)R访问数据库管理系统用的是ODBC接口,RODBC有很多函数,例如odbcConnect(dsn,uid="",pwd="") 建立一个到ODBC数据库的连接sqlFetch(channel,sqltable) 读取ODBC数据库中的某个表到一个数据框中sqlQuery(channel,query) 向ODBC数据库提交一个查询并返回结果sqlSave(channel,mydf,tablename= 将数据框写入或更新(append=TRUE)到sqtable,append=FALSE) ODBC数据库的某个表中sqlDrop(channel,sqtable) 删除ODBC数据库中的某个表close(channel) 关闭连接 R和一个通过ODBC连接的SQL数据库之间进行双向通信使用的是RODBC包。这就意味着R可以修改数据库中的内容。 处理数据对象的常用函数。这里列出几个简单的函数,例如length(object)显示对象中元素或成分的数量。Dim(object)显示某个对象的维度,ls()列出当前的对象列表,rm(object,object..)删除一个或多个对象。存储数据。在文件中写入一个对象可以使用writer.table。对象可以是数据框、向量、矩阵等。数据编辑器,数学运算。 随机序列。R可以在多种不同分布下产生随机数。例如rnorm()、rexp()等。一些简单的函数,例如,sum()对元素求和,max()求元素中的最大值,min()求元素中的最小值,cov求协方差阵。R绘图。例如图形的分割,用split.screen分割当前的绘图设备。绘图函数有很多,例如可以用plot(x,y)画二元图,也可以用pie(x)绘制饼图等。通过使用绘图参数,可以控制文字对齐方式,指定背景颜色,控制图形边框、符号类型等。 R语言不仅可以进行统计分析,还可以编写程序,数据清洗,模型预测,图像处理,网页抓取,绘制地图等。
3、 Linux操作系统
关于linux的学习,安装系统,然后掌握linux文件系统。在文件系统中,每个目录都代表者不同含义,例如在/bin是binary,这个目录下面放的是最经常使用的命令。/boot里面是内核和加载内核所需要的文件。/etc中放置的是关键的启动文件和配置文件。/home里面存放的是用户的主目录。/tmp放置的是临时文件。 Linux定义了七种文件类型,分别是:普通文件,目录,字符设备文件,块设备文件,本地域套接口,有名管道,符号链接。Linux中,每个文件都有一组9个权限位用来控制谁能够读写和执行该文件的内容。 Linux的基本命令。重用指令,例如ls显示文件或目录,还有mkdir创建目录,touch创建空文件,mv移动或重命名,rm删除文件等。系统管理命令,例如who显示在线登录用户,uname显示系统信息,ifconfig查看网络情况,ping测试网络连接情况,clear清屏,kill杀死进程,在杀死之前先用ps或top查看进程的id。打包压缩相关命令,tar -cvf只打包,tar -acvf打包并压缩。Linux管道,将一个命令的输出作为另一个命令的输入去执行,也就是把几个命令组合起来使用,后一个命令除以前一个命令的结果。vim的使用,vim有三种模式,分别是:命令模式、插入模式、编辑模式,例如使用ESC或i来切换模式,:q表示退出,强制退出用:!表示,保存并退出用:wq等。 Linux shell。输入的每个命令在登录到注销期间都会经过解释然后执行。而这个负责的机制就是shell。设计程序的时候使用shell也是不错的选择。掌握通配符的使用,例如*代表多个字母或数字,?代表一个字母或数字等。
原文链接:http://www.jxszl.com/lwqt/yzlw/177272.html