1. 简介
在本教程中,我们将讨论Project Valhalla为Java生态系统带来的一个非常有趣的功能,即基于值的类。基于值的类在Java 8中引入,并在后续版本中进行了重大重构和增强。
2. 基于值的类
2.1 Project Valhalla
Project Valhalla是OpenJDK的一个实验项目,旨在为Java添加新的特性和功能。该计划的主要目标是增加对值类型、泛型特化和性能改进的改进支持,同时保持完全的向后兼容性。
基于值的类是Valhalla项目引入的功能之一,旨在向Java语言引入原始的、不可变的值,而不会增加传统面向对象类带来的额外开销。
2.2 原始类型和值类型
在我们正式定义基于值的类之前,让我们先看一下Java中的两个重要语义-原始类型和值类型。
Java中的原始数据类型是表示单个值的简单数据类型,而不是对象。Java提供了八种这样的基本数据类型:byte、short、int、long、float、double、char和boolean。虽然这些都是简单类型,但Java为每个类型提供了包装类,以便我们以面向对象的方式与它们进行交互。
同样重要的是要记住,Java会自动执行自动装箱和拆箱,以有效地在对象类型和基本类型之间进行转换:
int primitive_a = 125;
Integer obj_a = 125; // this is autoboxed
Assert.assertSame(primitive_a, obj_a);
原始类型位于堆栈内存中,而我们在代码中使用的对象则位于堆内存中。
Valhalla项目在Java生态系统中引入了一种介于对象和原始类型之间的新类型,称为值类型。值类型是不可变类型,并且它们没有任何标识,这些值类型也不支持继承。
值类型不是通过其引用而是通过其值来寻址,就像原始类型一样。
2.3 基于值的类
基于值的类是被设计为行为类似于Java中的值类型并封装值类型的类。JVM可以在值类型和基于值的类之间自由切换,就像自动装箱和拆箱一样。因此,出于同样的原因,基于值的类是无标识的。
3. 基于值的类的属性
基于值的类是表示简单不可变值的类。基于值的类具有多个属性,可以将这些属性分类为一些常规主题。
3.1 不可变性
基于值的类旨在表示不可变数据,类似于int等原始类型,并具有以下特征:
- 基于值的类始终是final的
- 它仅包含final字段
- 该类可以扩展Object类或不声明实例字段的抽象类的层次结构
3.2 对象创建
让我们了解创建基于值的类的新对象是如何工作的:
- 该类没有声明任何可访问的构造函数
- 如果存在可访问的构造函数,则应将它们标记为已弃用以便删除
- 该类只能通过工厂方法实例化,从工厂接收的实例可能是也可能不是新实例,并且调用代码不应对其标识做出任何假设
3.3 Identity和equals()、hashCode()、toString()方法
基于值的类是没有标识的,由于它们仍然是Java中的类,因此我们需要了解从Object类继承的方法是如何发生的:
- equals()、hashCode()和toString()的实现仅根据其实例成员的值定义,而不是根据它们的标识或任何其他实例的状态
- 我们认为两个对象仅在对象的equals()检查上相等,而不是基于引用的相等,即==
- 我们可以互换使用两个相等的对象,并且它们应该在任何计算或方法调用上产生相同的结果。
3.4 一些额外的注意事项
在使用基于值的类时,我们应该考虑一些额外的限制:
4. 基于值的类的示例
4.1 JDK中基于值的类
JDK中有几个类遵循基于值的类规范。
首次引入时,java.util.Optional和DateTime API(java.time.LocalDateTime)是基于值的类。从Java 16及更高版本开始,Java已将Integer和Long等基本类型的所有包装类定义为基于值的。
这些类具有jdk.internal包中的@ValueBased注解:
@jdk.internal.ValueBased
public final class Integer extends Number implements Comparable<Integer>, Constable, ConstantDesc {
// Integer class in the JDK
}
4.2 自定义基于值的类
让我们创建遵循上面定义的基于值的类规范的自定义类。对于我们的示例,我们采用一个Point类来标识3D空间中的一个点,该类有3个整数字段x、y和z。
我们可以认为Point定义是基于值的类的良好候选者,因为空间中的特定点是唯一的并且只能通过其值来引用。它是恒定且明确的,很像值为302的整数。
我们首先将类定义为final,并将其属性x、y和z定义为final。我们还将构造函数设为私有:
public final class Point {
private final int x;
private final int y;
private final int z;
// inaccessible constructor
private Point(int x, int y, int z) {
this.x = x;
this.y = y;
this.z = z;
}
// ...
}
现在,让我们预先创建该类的origin(0, 0, 0)实例,每次调用创建x = 0、y = 0和z = 0的点时,我们都会返回相同的实例:
private static Point ORIGIN = new Point(0, 0, 0);
我们现在需要以工厂方法的形式提供对象创建机制:
public static Point valueOfPoint(int x, int y, int z) {
// returns a cached instance if it is the origin, or a new instance
if (isOrigin(x, y, z)) {
return ORIGIN;
}
return new Point(x, y, z);
}
// checking if a point is the origin
private static boolean isOrigin(int x, int y, int z) {
return x == 0 && y == 0 && z == 0;
}
工厂方法valueOfPoint()可以根据参数返回一个新实例或缓存实例,这迫使调用代码不对对象的状态做出任何假设或比较两个实例的引用。
最后,我们应该仅根据实例字段的值定义equals()方法:
@Override
public boolean equals(Object other) {
if (other == null || getClass() != other.getClass()) {
return false;
}
Point point = (Point) other;
return x == point.x && y == point.y && z == point.z;
}
@Override
public int hashCode() {
return Objects.hash(x, y, z);
}
我们现在有一个Point类,它可以充当基于值的类。从jdk.internal包导入后,我们可以将@ValueBased注解添加到该类中。但是,这对于我们的案例来说不是强制性的。
现在让我们测试(1,2,3)表示的空间中同一点的两个实例是否相等:
@Test
public void givenValueBasedPoint_whenCompared_thenReturnEquals() {
Point p1 = Point.valueOfPoint(1, 2, 3);
Point p2 = Point.valueOfPoint(1, 2, 3);
Assert.assertEquals(p1, p2);
}
此外,为了本练习,我们还可以看到,如果通过引用进行比较,则在创建两个原点时,两个实例是相同的:
@Test
public void givenValueBasedPoint_whenOrigin_thenReturnCachedInstance() {
Point p1 = Point.valueOfPoint(0, 0, 0);
Point p2 = Point.valueOfPoint(0, 0, 0);
// the following should not be assumed for value-based classes
Assert.assertTrue(p1 == p2);
}
5. 基于值的类的优点
现在我们知道什么是基于值的类以及如何定义基于值的类,让我们理解为什么我们可能需要基于值的类。
基于值的类是Valhalla规范的一部分,仍处于实验阶段并继续发展。因此,该功能的好处可能会随着时间的推移而改变。
到目前为止,使用基于值的类带来的最重要的好处是内存利用率。基于值的类具有更高的内存效率,因为它们没有基于引用的标识。此外,JVM可以重用现有实例或根据需求创建新实例,从而减少内存占用。
此外,它们不需要同步,从而提高了整体性能,尤其是在多线程应用程序中。
6. 基于值的类与其他类型的区别
6.1 不可变类
Java中的不可变类与基于值的类有很多共同点,因此,了解它们之间的差异非常重要。
虽然基于值的类是新的并且是正在进行的实验功能的一部分,但不可变类长期以来一直是Java生态系统的核心和组成部分。Java中的String类、Enums和包装类(例如Integer类)都是不可变类的示例。
不可变类不像基于值的类那样是无标识的。具有相同状态的不可变类的实例是不同的,我们可以根据引用相等性来比较它们。基于值的类的实例没有基于引用的相等概念。
不可变类可以自由地提供可访问的构造函数,并且可以具有多个属性和复杂的行为。但是,基于值的类表示简单的值,并且不定义具有依赖属性的复杂行为。
最后,我们应该注意到,根据定义,基于值的类是不可变的,但反之则不然。
6.2 记录
Java在Java 14中引入了Record的概念,作为传递不可变数据对象的简单方法。记录和基于值的类实现不同的目的,即使它们在行为和语义上看起来相似。
记录和基于值的类之间最明显的区别是记录具有公共构造函数,而基于值的类则缺少公共构造函数。
7. 总结
在本文中,我们讨论了Java中基于值的类和值类型的概念。我们谈到了基于值的类必须遵守的重要属性及其带来的好处。我们还讨论了基于值的类和类似的Java概念(例如不可变类和记录)之间的差异。
与往常一样,本教程的完整源代码可在GitHub上获得。