Julia 初学者指南(二) | 数据类型与函数基础

唠唠闲话

Julia 是一种高性能的动态编程语言，特别适用于数值分析和计算科学领域。它拥有一个强大的类型系统和灵活的多重分派机制，这使得代码易于编写同时还能保持接近 C 语言的运行速度。此外，Julia 也能无缝调用 C 和 Fortran 库，使得它能充分利用现有的高性能计算资源。
本系列教程旨在带领读者从零开始，逐步深入学习 Julia 编程。无论你是编程新手还是有经验的开发者，这些教程都将为你提供清晰的学习路径和丰富的示例代码，帮助你快速掌握 Julia 的核心技术和高级功能。

上节介绍了 Julia 的安装、配置及常用编译器。本篇将探讨 Julia 中的数据类型和函数，这是编程的基础内容。

Julia 的交互模式

概览

本节介绍 Julia 的五种交互模式，并重点介绍包管理模式，这五种模式分别为：

模式	说明	进入方式
Julian 模式	执行 Julia 代码的地方	默认模式，在其他模式下通过退格键 Backspace 进入
Pkg 模式	Julia 装包时使用的模式	在 Julian 模式按 `]` 进入
Help 文档模式	查询文档时使用	在 Julian 模式下按 `?` 进入
Shell 模式	切换到系统命令行	在 Julian 模式下按 `;` 进入
Debug 模式	进入代码调试模式	安装 Debugger.jl 后使用

除了 Debug 模式，其他四种模式都会经常用到，进入方式不仅适用于终端，也适用于 Jupyter Notebook 等环境。

基本介绍

四种常见模式：

初始进入 Julia 时，显示的模式就是 Julian 模式，左侧是绿色的 julia>，页面显示如下：
在 Julian 模式下，按下 ] 进入 Pkg 模式（包管理模式），如下图：
在任意模式下，按退格键（键盘上的 Backspace）可以回到 Julian 模式。
在 Julian 模式下，按下 ? 进入 Help 模式，此时输入函数可以查看使用文档：
在 Julian 模式下，按下 ; 进入 Shell 模式，这个接触过 Linux 的应该懂怎么用。
Debug 模式个人目前用得不多，暂略。

包的安装

Julia 中安装工具包的方法很简单，有两种方式，一是使用 Pkg 模式，二是在 Julian 模式下调用 Pkg 模块。

方法一，输入 ] 进入 Pkg 模式，如下图，左侧括号显示 Julia 的开发环境，@v1.6 代表 Julia 1.6 版本，使用默认环境：
输入 add <包名称> 安装具体模块，比如下图，模块下载到用户主目录的 .julia 下：
方法二，退格回到 Julian 模式，输入 using Pkg 导入包管理模块，再输入 Pkg.add("<包名称>") 安装模块，如下图，注意包名称要用引号包含起来：
包安装完成后，可以用 using <包名称> 测试模块导入。

以上只涉及了 Pkg.add 命令，包管理还有很多常用命令，后续再单独写篇介绍，推荐阅读：Pkg 官方手册，Julia 读文档之包的实战。

Julia 的数据结构

基本语法

在 Julia 中，# 用于注释。为了方便学习，相关知识点都写在代码注释中。

@xxx 是宏 (macro) 的语法。宏可以实现“利用代码生成代码”。
演示常用的两种宏：
- @show 显示运算信息，表达式之间用空格隔开。
- @info 类似 @show，但以第一个变量为打印信息。

示例：

x, y = 1, 2
@show x + y  # x + y = 3
@show x + y x - y  # x + y = 3 \n x - y = -1
@info "记录信息" x y x + y

显示结果：
result

数据类型

整型和浮点数类型

x = 1
@show typeof(x)  # 默认整型
λ = .1
@show typeof(λ)  # .1 等同于 0.1

输出内容：
2021-10-24 13-49-27 的屏幕截图

Julia 支持使用 LaTeX，比如 $\lambda$ 通过 \lambda + <TAB> 输入；下标 $c_i$ 通过 c\_i + <TAB> 输入。
在 Julia 中，“数值 * 变量”用连接简记，比如 2x 等同于 2 * x。

其他数值类型

@show typeof(1 + im)  # im 代表虚数 i
@show typeof(1.0 + 2im)  # 浮点虚数
@show 1 / 0  # 无穷大
@show 0 * Inf  # 不定数
@show typeof(Inf)  # Float64
@show typeof(NaN)  # Float64
@show typeof(pi)  # 无理数
@show typeof(missing)  # 缺失类型，用于统计
@show 2 * missing  # missing
@show typeof(nothing)  # 相当于 Python 的 None

输出内容：
2021-10-24 13-52-53 的屏幕截图

字符相关

@show typeof('c')  # 单引号代表字符
@show typeof("c")  # 双引号代表字符串
@show 'c' == "c"  # 数据结构不同
@show "c"[1] === 'c'  # 字符串用索引取出的数据类型是字符
@show "c"[:] == 'c'  # 切片取出字符串
@show "hello " * "world"  # 字符串拼接用 *
@show "hi" ^ 3  # 字符串复制用 ^
var = 2333
@show "hello $var"  # 使用 $ 插入实际变量
@show "hello $(var / 10)"  # 插入运算结果

输出内容：
2021-10-24 13-55-44 的屏幕截图

字符转数值

使用 parse，不能直接用 Int 或 Float64：

@show parse(Int, "1")  # Int 类型
@show parse(Float64, "1")  # Float 类型

输出内容：
20211025122853

容器数据类型

列向量

使用 [] 得列向量 Vector：

@show x = [1, 2, 3]  # Vector (column vector)
@show typeof(x)  # 等同于 Array{Int64, 1}
@show Vector(3:5)  # Vector(3:5) = [3, 4, 5]

输出内容：
深度截图_选择区域_20211025123253

切片规则

左闭右闭，首位索引为1，末位索引为 end：

x = [1, 2, 3]
@show x[1:end-1]  # end-1 倒数第二位置
@show x[:]  # 取全部
@show x[:] === x  # 切片创建了新对象

输出内容：
深度截图_选择区域_20211025123048
切片两端留空代表取全部，此时得到的是新对象；和 Python 不同的是，切片不能只写一侧，比如 x[2:]。

常用属性

size(x): 尺寸，返回 Tuple{Int64} 类型
length(x): 长度，类似 Python 的 len
eltype(x): 元素类型

矩阵

@show y = [1 2 3]  # 空格分列，分号换行
@show [1 2 3 4; 5 6 7 8]
@show [1 2 3 4
5 6 7 8]  # 支持用换行号换行
@show typeof(y)  # 行向量为矩阵类型
@show size(y)  # 矩阵形状
@show size(x)  # 列向量形状
@show x == y  # false | 矩阵尺寸不同，返回否
@show x' == y  # 向量转置，数据格式化为矩阵，类型相等
@show y' == x  # x 仍是向量，y 是 3*1 矩阵

输出内容：
深度截图_选择区域_20211025123737

元组（不可变类型）

x = (1, 2, 3.)
@show typeof(x)  # 元组会单独记录每个位置的数据结构
@show x = 1, 2, 3.  # 定义时括号可省
@show x, y = 1, 2  # 同 Python 的拆包功能
@show x, y = 1, 2, 3, 4, 5  # 拆包多余部分被丢弃

输出内容：
深度截图_选择区域_20211025123926

容器内使用 `...` 展开序列

x = [1, 2, 3]
@show (0, x[2:end]...) [3, x...]

输出内容：
深度截图_选择区域_20211025124048

元组的拆分组合操作运行很快

modify_first!(t::Tuple, x) = (x, t[2:end]...)
t = (1, 2, 3)
@btime modify_first!($t, 0)

20211103142242

字典

注意：初始化后，字典键值类型确定，新键值必须保持类型一致。

# Dict{Any, String} with 3 entries
d = Dict(1 => "item1","2" => "item2",(3, 4) => "item3-4")  # 创建字典
@show d[1]  # 取出元素
d[3] = "item3"  # 新增键值
# d[2] = 2  # 报错，与字符串类型不符
@show typeof(1 => 2)  # 创建使用了 Pair 类型
items = (x => x^2 for x in 1:5)  # 先创建 Pair 
@show d = Dict(items)  # 再生成字典

输出内容：
深度截图_选择区域_20211025124503

命名元组

可以简单理解为不可变的字典类型：

d = (x = "first item", y = "second item") 
@show typeof(d)  # 命名元组
@show d[:x]  # 使用 Symbol 取出元素
@show d.y  # 使用 . 取出函数

注意键名必须是变量，不能为数值之类：
深度截图_选择区域_20211025124633

集合交并补操作

x = [1, 2, 3]
y = [2, 3, 4]
@show setdiff(x, y)  # setdiff(x, y) = [1]
@show union(x, y)  # union(x, y) = [1, 2, 3, 4]
@show intersect(x, y)  # intersect(x, y) = [2, 3]

输出内容：
深度截图_选择区域_20211025124703

列表生成器和迭代器

和 Python 类似：

@info "列表生成器" [i for i in -0.5:0.2:1]
@info "迭代器" (i for i in -0.5:0.2:1)

输出内容：
20211103143826

由于迭代器不需要创建中间变量来存储所有结果，在内存使用上是比较高效的：

clamp(x, lo=0, hi=1) = x < lo ? lo : x > hi ? hi : x
f_list() = Dict([x => clamp(x) for x in -0.5:0.2:1.5])
f_generator() = Dict((x => clamp(x) for x in -0.5:0.2:1.5))
@btime f_list()  # 使用列表生成器
@btime f_generator()  # 使用迭代器

输出内容：
深度截图_选择区域_20211104215458

Julia 的函数

基本使用

用关键字 function 定义函数：

# 如果没有 return ，默认返回最后一个变量
function f(x, y)tmp = x + yreturn tmp
end

用单行定义函数：
```
f(x, y) = x + y
```
三元表达式 cond ? true_rst : false_rst，注意 ? 和 : 前后要留空格：
```
greater(a, b) = a > b ? true : false
@show greater(1, 2)
```
用 = 预定义参数值：
```
f(x, y=10) = x + y
@show f(1) f(1, 2)  # 使用预定义
```
注意：与 Python 不同，Julia 函数的默认值是在函数调用时确定的，因此如果预定义值为可变对象，下次调用将重新创建，不必担心被修改。

函数指定参数类型，类似 C++ 的重载：

f(x::Tuple) = "input tuple"
f(x::Int) = "input int"
@show f((1, 2))  # 输入元组
@show f(1)  # 输入整型

深度截图_选择区域_20211025125351

可变参数用 ...，类似 Python 的 *：

f(x, y...) = y  # 定义函数
@show f(1)  # 可变参为空元组
@show f(1, 2, 3, 4)

深度截图_选择区域_20211025125356

关键词参数：

f(x; y, z=10) = x + y + z  # 分号隔开关键字
@show f(0, y=2)  # z 取默认值，y 用关键字赋值
# f(1, 2, 3)  # 报错，必须用关键字赋值
f(x) = 0  # 函数重载只比对关键字前的部分
@show f(0)  # 函数被重置

深度截图_选择区域_20211025125401

当函数修改变量信息时，约定上，函数名末尾追加 !：
```
x = [2, 1]
sort(x)
@show x  # x 不变
sort!(x)
@show x  # x 改变
```
Julia 编写函数时，可以写两个版本，一个带 ! 允许修改变量，运算速度快；再写一个不带 ! 的版本，通过调用第一个函数来定义。

函数式编程

一等公民

在 Julia 中，函数是“一等公民”（First-class citizen）。在编程语言中，一等公民是指支持所有操作的实体，这些操作通常包括作为参数传递、从函数返回、修改并分配给变量等。比如 int 类型，它支持作为参数传递，可以从函数返回，也可以赋值给变量，因此它是一等公民。类似的，函数作为一等公民，意味着可以把函数赋值给变量或存储在数据结构中，也可以把函数作为其他函数的参数或者返回值。一般来说，函数式编程语言、动态语言和现代编程语言中，函数都会作为一等公民。

Julia 与函数式编程

Julia 里的符号可以当函数来用，比如：
```
@show +(1, 2)  # 相当于 1 + 2
```

高阶函数：

f = x -> x^2  # 匿名函数
map(f, 1:5)  # [1, 4, 9, 16, 25] | 函数作用在右侧数据上，返回向量
map((x, y) -> x + y, 1:5, 6:10)  # [7, 9, 11, 13, 15] | 二元函数

支持输入值为函数的还有 reduce、mapreduce、foreach、sum、filter 等。这部分和 MMA 类似，就不仔细介绍了。

do 创建一个匿名函数并将其作为第一个参数传递给函数调用：

map(1:5) do xreturn x^2
end
# 相当于
function f(x)return x^2
end
map(f, 1:5)

Curry 化

柯里化，指把接受多个参数的函数变换成接受多个单一参数的函数的技术。

例如 > 是一个二参函数，可以通过指定一参来创建一个新函数：

filter(>(3), 1:10)

这里 >(3) 就是一个柯里化的函数，它接受一个参数，返回一个函数。

一般的，在 Julia 中可以用 Base.Fix1 或 Base.Fix2 来实现柯里化：

f(x, y) = x + y
f1 = Base.Fix1(f, 1)
f1.(1:5)  # [2, 3, 4, 5, 6]

面向对象

和 Mathematica 一样，Julia 不支持面向对象，不能继承方法。但面向对象的很多功能可以用结构体及多重派发替代。

Julia 中的抽象对象，某种程度上可以替代继承的功能，我们下一节会详细介绍。

总结

本节内容，介绍了 Julia 的交互模式，基本的数据结构，函数及函数式编程。这些基础知识将为进一步深入学习 Julia 奠定坚实的基础。