扩展名 | .nc |
---|---|
互联网媒体类型 | application/netcdf application/x-netcdf |
开发者 | 美国大气科学研究大学联盟(UCAR) |
最新版本 | 4.9.2[1](2023年3月17日,19個月前) |
格式类型 | 科学二进制数据 |
扩展自 | 通用数据格式(CDF) 外部数据表示法(XDR) 层级数据格式(HDF) |
网站 | www |
网络通用数据格式(英語:Network Common Data Form,netCDF)是一种自描述、与机器无关、基于阵列的科学数据格式,同时也是支持创建、访问和共享这一数据格式的函式库。该项目主页位于美国大气科学研究大学联盟(UCAR)的Unidata规划网站。它也是netCDF软件、标准开发、更新等的主要来源。netCDF格式是一种开放标准。
netCDF项目开始于1989年,UCAR目前对其积极支持,在新发行版中改进性能、增加功能并修正缺陷,当前版本系列是netCDF-4。netCDF的经典格式(CDF-1)和64位偏移量格式(CDF-2),是开放地理空间协会采用的国际标准[2]。
1985年美国国家航空航天局(NASA)的国家空间科学数据中心(NSSDC),设计并开发了通用数据格式(CDF),CDF最初是用FORTRAN写成,并只能在VAX/VMS环境下获得[3]。Unidata在1987年8月成立了关于CDF的工作组,提议探索与NASA协作,扩展CDF的FORTRAN接口,定义C接口,并允许用一个单一调用访问数据聚集,同时要维持与现存NASA接口兼容的可能性。在1988年早些时候,Unidata的Glenn Davis用C开发了原型netCDF包,它位于网络表示层XDR格式的上层[4],而结果的程序可以在UNIX和VMS系统二者上实现。NASA的CDF和Unidata的netCDF从此独立发展,但新近的CDF版本与netCDF共享了很多特征。[5]
1991年Unidata发布了netCDF版本2.0,1997年发布了版本3.3。2003年7月美国能源部的阿贡国家实验室和西北大学,贡献了叫做并行netCDF(或称PnetCDF)的一个netCDF并行计算扩展[6]。2004年在NASA的资助下,Unidata与美国国家超级计算应用中心(NCSA),开始合作增进netCDF和HDF5的互操作性。2008年Unidata发布了版本4.0,允许使用HDF5数据文件格式。同时发布了版本3.6.3,它与版本4.0是同样的代码但关掉了netcdf-4特征,目前netCDF-3库仍然在世界各地被广泛使用。2010年Unidata发布了版本4.1.1,增加了对C和Fortran客户端通过OPeNDAP访问远程数据的特定子集的支持,并使用PnetCDF扩展库,支持在netCDF经典格式(CDF-1、CDF-2和CDF-5)上的并行I/O。[5]
netCDF库支持多种不同的二进制格式的netCDF文件[7]:
所有格式都是“自描述的”。 这意味其中有一个头部,它描述文件余下部分的格局,特别是阵列数据,连同以名称/值特性形式的任意文件元数据。这个格式是跨平台的,涉及的问题如字节序在软件库中解决。数据以允许有效率的子集化的方式来存储。
起始于版本4.0,netCDF API允许使用HDF5数据格式。netCDF用户可以建立HDF5文件从而获得netCDF格式不具备的利益,比如更大的文件和多重无限制的维度。
完全后向兼容,可访问旧有netCDF文件并支持以前版本的C和Fortran API。
netCDF常用于气候学、气象学和海洋学应用,如天气预报、气候变化;也用于地理信息系统应用,是很多GIS应用的输入/输出格式;并用于通用科学数据交换。从它的站点引述如下[10]:netCDF(网络公用数据格式)是用于面向阵列数据访问的一组接口,和针对C、Fortran、C++、Java和其他语言的一套自由发行的数据访问库。netCDF库支持用来表示科学数据的一种机器无关格式。接口、库和格式一起支持建立、访问和共享科学数据。
UCAR发布的软件库提供了对netCDF文件的读写访问,编码和解码所需的阵列和元数据。核心库是用C编写的,并为C或C++应用提供API,为Fortran应用提供了两个API,一个给Fortran 77,一个给Fortran 90。Unidata还开发维护一个独立实现,使用100% Java写成,它扩展了核心数据模型并增加了额外的功能。其他编程语言基于netCDF的C库也能获得至其API的接口,这包括R、Perl数据语言、Python、Ruby、Haskell[11]、Mathematica、MATLAB、IDL和Octave。API调用规定在不同语言间非常类似,当然会有着不可避免的不同语法。不同版本的API调用是后向兼容的。应用编程者使用支持这个库的语言,在正常情况下不需要关心文件结构自身,即使它作为开放格式是可以获知的。
netCDF4-python
[12],此外,读写netCDF-4格式可用h5netcdf[13];读写其他netCDF格式可用SciPy。xarray
模块可将netCDF导入导出于pandas的DataFrame
对象[14];cfgrib是ECMWF发行的使用ecCodes并遵从CF约定,将GRIB映射到NetCDF通用数据模型的接口[15]。NCAR的PyNIO模块支持多种netCDF格式,它的开发已经停止而进入维护状态[16]。现在已经出产了范围广泛的使用netCDF文件的应用程序。它们的范围从命令行实用程序到图形可视化包。下面列出其中一小部分,而更长的列表可见于UCAR网站列表[19]:
气候和预报(CF)约定是对地球科学数据的元数据约定,意图用于促进处理和共享通过netCDF应用编程接口(API)建立的文件。CF约定于2003年建立,普遍化并扩展了早期的协作海洋/大气研究数据服务(COARDS)约定[29]和对气候数据的Gregory/Drach/Tett(GDT)约定[30]。CF约定定义了与数据包含在同一个文件中的元数据,从而使得文件“自我描述”,提供对在每个变量中的数据表示的是什么的确切描述,和数据的空间的和时间的属性的确切描述,包括关于网格的信息,比如网格单元边界和单元平均方法。这使得能够使用来自不同来源的数据,确定哪些数据是可比较的,并允许建造有着强力的提取、重新插值和显示能力的应用。Unidata 在2007年至2011年开发了LibCF库[31]。
并行netCDF扩展包建造在MPI-IO之上,它是对MPI的I/O扩展。使用高层netCDF数据结构,并行netCDF库可以进行优化而在多处理器间高效分配文件读和写应用。并行netCDF包只可以读/写经典和64-bit偏移量格式。并行netCDF不能读或写在netCDF-4.0中可获得的基于HDF5的格式。并行netCDF包使用不同但类似的Fortran和C的API。
在Unidata netCDF库中自从版本4.0已经支持对HDF5数据文件的并行I/O。Unidata netCDF C库自从版本4.1.1使用并行netCDF库支持对经典和64-bit偏移量文件的并行 I/O,但使用netCDF API。
netCDF C库,和基于它的库:Fortran 77和Fortran 90、C++和所有第三方库,自从版本4.1.1开始可以读一些其他数据格式的数据。HDF5格式的数据可以读取,但有一些限制[32]。使用HDF4科学数据(SD)API建立的HDF4格式的数据,可以用netCDF C库读取。
netCDF-Java库目前已经能够读取很多文件格式和远程访问协议,并且正在开发对一些其他的格式的支持。因为这些都是通过netCDF API透明的进行访问,netCDF-Java库被称为实现了科学数据集的“通用数据模型”。