Entities 或 DTO – 应该使用哪种投影?
JPA 和 Hibernate 允许你在 JPQL 和 Criteria 查询中使用 DTO 和实体(Entity)作为投影。当我在在线培训或研讨会上谈论 Hibernate 的性能时,经常被问到,使用哪种投影是否重要。
答案是:是的!为用例选择正确的投影可能会对性能产生巨大的影响。
我并不是说只检索你需要的数据。很明显,检索不必要的信息不会为你带来任何性能优势。
DTO 和 Entity 之间主要的差异
实体和 DTO 之间还有另一个经常被忽视的区别。持久化上下文管理实体。
当你想更新一个实体时,这是一件很棒的事情。你只需要用新值调用一个 setter 方法。Hibernate 将处理所需的 SQL 语句,并将更改写入数据库。
使用起来很舒服,但你不能免费得到它。Hibernate 必须对所有托管实体执行脏检查,以确定是否需要在数据库中存储任何更改。这需要时间,当你只想向客户端发送一些信息时,这是完全不必要的。
你还需要记住,Hibernate 和任何其他 JPA 实现都将所有托管实体存储在一级缓存中。这似乎是一件好事。它可以防止重复查询的执行,并且是 Hibernate 的写后优化所必需的。但是管理一级缓存需要时间,如果选择数百或数千个实体,甚至可能成为一个问题。
因此,使用实体会产生开销,使用 DTO 时可以避免这种开销。但这是否意味着你不应该使用实体?
不是的。
写操作的投影
实体(Entity)投影对于所有写入操作都很有用。Hibernate 和任何其他 JPA 实现都可以管理实体的状态,并创建所需的 SQL 语句来将更改持久化到数据库中。这使得大多数创建、更新和删除操作的实现非常简单高效。
EntityManager em = emf.createEntityManager();
em.getTransaction().begin();
Author a = em.find(Author.class, 1L);
a.setFirstName("Thorben");
em.getTransaction().commit();
em.close();
读操作的投影
但是只读操作应该以不同的方式处理。如果你只想从数据库中读取一些数据,Hibernate 不需要管理任何状态或执行脏检查。
因此,从理论角度来看,DTO 应该是读取数据的更好投影。但这真的有什么不同吗?
我做了一个小的性能测试来回答这个问题。
测试准备
我使用了以下域模型进行测试。它由一个 Author
和一个 Book
实体组成,它们通过多对一的关联相关联。因此,每本书(Book)都由一位作者(Author)撰写。
@Entity
public class Author {
@Id
@GeneratedValue(strategy = GenerationType.AUTO)
private Long id;
@Version
private int version;
private String firstName;
private String lastName;
@OneToMany(mappedBy = "author")
private List bookList = new ArrayList();
...
}
为了确保 Hibernate不会获取任何额外的数据,我将 Book
实体上 @ManyToOne
关联的 FetchType
设置为 LAZY
。
@Entity
public class Book {
@Id
@GeneratedValue(strategy = GenerationType.AUTO)
private Long id;
@Version
private int version;
private String title;
@ManyToOne(fetch = FetchType.LAZY)
@JoinColumn(name = "fk_author")
private Author author;
...
}
我创建了一个包含 10 位作者(Author)的测试数据库。他们每人写了 10本书(BOOK)。因此,数据库总共包含 100 本书。
在每个测试中,我将使用不同的投影来检索所有 100 本书,并测量执行查询和事务所需的时间。为了减少任何副作用的影响,我做了 1000 次,并测量了平均时间。
好的,那我们开始吧。
检索 Entity
实体投影是大多数应用中最受欢迎的投影。你已经拥有了实体,JPA 可以轻松地将其用作投影。
所以,让我们运行这个小测试用例,并测量检索 100 个 Book
实体需要多长时间。
long timeTx = 0;
long timeQuery = 0;
long iterations = 1000;
// Perform 1000 iterations
for (int i = 0; i < iterations; i++) {
EntityManager em = emf.createEntityManager();
long startTx = System.currentTimeMillis();
em.getTransaction().begin();
// Execute Query
long startQuery = System.currentTimeMillis();
List<Book> books = em.createQuery("SELECT b FROM Book b").getResultList();
long endQuery = System.currentTimeMillis();
timeQuery += endQuery - startQuery;
em.getTransaction().commit();
long endTx = System.currentTimeMillis();
em.close();
timeTx += endTx - startTx;
}
System.out.println("Transaction: total " + timeTx + " per iteration " + timeTx / (double)iterations);
System.out.println("Query: total " + timeQuery + " per iteration " + timeQuery / (double)iterations);
平均而言,执行查询、检索结果并将其映射到 100 个 Book
实体需要 2 毫秒。如果包含事务处理,则为 2.89 ms。对于一台小而不太新的笔记本电脑来说,这还不错。
Transaction: total 2890 per iteration 2.89
Query: total 2000 per iteration 2.0
默认 FetchType
对 To-One 关联的影响
当我向你展示 Book
实体时,我指出我将 FetchType
设置为 LAZY
以避免额外查询。默认情况下,一对一关联的 FetchType
是 EAGER
,它告诉 Hibernate 立即初始化关联。
这需要额外的查询,如果你的查询检索了多个实体,则会对性能产生巨大影响。让我们将 Book
实体更改为使用默认的 FetchType
并执行相同的测试。
@Entity
public class Book {
@ManyToOne
@JoinColumn(name = "fk_author")
private Author author;
...
}
这一小小的变化使测试用例的执行时间增加了两倍多。现在执行查询和映射结果需要 7.797 毫秒,而不是 2 毫秒。每个事务的时间从 2.89 ms 增加到 8.681ms。
Transaction: total 8681 per iteration 8.681
Query: total 7797 per iteration 7.797
因此,对于“对一"关联,请确保将 FetchType
设置为 LAZY
。
检索不可变(@Immutable)实体(Entity)
有人要求我在测试中添加一个不可变实体。有趣的问题是:返回用 @Immutable
注释的实体的查询性能会更好吗?
Hibernate 知道它不必对这些实体执行任何脏检查,因为它们是不可变的。这可能会带来更好的表现。所以,让我们试试。
我将以下 ImmutableBook
实体添加到测试中。
@Entity
@Table(name = "book")
@Immutable
public class ImmutableBook {
@Id
@GeneratedValue(strategy = GenerationType.AUTO)
private Long id;
@Version
private int version;
private String title;
@ManyToOne(fetch = FetchType.LAZY)
@JoinColumn(name = "fk_author")
private Author author;
...
}
这是 Book
实体的副本,带有 2 个附加注释。@Immutable
注释告诉 Hibernate 不能更改这个实体。@Table(name = “book”)
将实体映射到 book
表。因此,它映射了与 Book 实体相同的表,我们可以使用与以前相同的数据运行相同的测试。
long timeTx = 0;
long timeQuery = 0;
long iterations = 1000;
// Perform 1000 iterations
for (int i = 0; i < iterations; i++) {
EntityManager em = emf.createEntityManager();
long startTx = System.currentTimeMillis();
em.getTransaction().begin();
// Execute Query
long startQuery = System.currentTimeMillis();
List<Book> books = em.createQuery("SELECT b FROM ImmutableBook b")
.getResultList();
long endQuery = System.currentTimeMillis();
timeQuery += endQuery - startQuery;
em.getTransaction().commit();
long endTx = System.currentTimeMillis();
em.close();
timeTx += endTx - startTx;
}
System.out.println("Transaction: total " + timeTx + " per iteration " + timeTx / (double)iterations);
System.out.println("Query: total " + timeQuery + " per iteration " + timeQuery / (double)iterations);
有趣的是,无论实体是否不可变,它都没有任何区别。事务和查询的平均执行时间与之前的测试几乎相同。
Transaction: total 2879 per iteration 2.879
Query: total 2047 per iteration 2.047
使用 QueryHints.HINT_READONLY 检索实体
有人建议涵盖一个带有只读查询的测试。所以,有了这部分。
此测试使用我在文章开头展示的 Book
实体。但它需要改变测试用例。
JPA 和 Hibernate 支持一组查询提示,允许你提供有关查询及其执行方式的其他信息。查询提示 QueryHints.HINT_READONLY
告诉 Hibernate 检索只读模式下的实体。因此,Hibernate 不需要对它们执行任何脏检查,它可以应用其他优化。
你可以通过调用 Query
接口上的 setHint
方法来设置此提示。
long timeTx = 0;
long timeQuery = 0;
long iterations = 1000;
// Perform 1000 iterations
for (int i = 0; i < iterations; i++) {
EntityManager em = emf.createEntityManager();
long startTx = System.currentTimeMillis();
em.getTransaction().begin();
// Execute Query
long startQuery = System.currentTimeMillis();
Query query = em.createQuery("SELECT b FROM Book b");
query.setHint(QueryHints.HINT_READONLY, true);
query.getResultList();
long endQuery = System.currentTimeMillis();
timeQuery += endQuery - startQuery;
em.getTransaction().commit();
long endTx = System.currentTimeMillis();
em.close();
timeTx += endTx - startTx;
}
System.out.println("Transaction: total " + timeTx + " per iteration " + timeTx / (double)iterations);
System.out.println("Query: total " + timeQuery + " per iteration " + timeQuery / (double)iterations);
你可能会认为,将查询设置为只读可以提供明显的性能优势。Hibernate 必须执行的工作更少,所以它应该更快。
但正如你在下面看到的,执行时间几乎与之前的测试相同。至少在这个测试场景中,将 QueryHints.HINT_READONLY
设置为 true
并不能提高性能。
Transaction: total 2842 per iteration 2.842
Query: total 2006 per iteration 2.006
检索 DTO
加载 100 个 Book
实体大约需要 2 毫秒。让我们看看在 JPQL 查询中使用构造函数表达式获取相同数据的性能是否更好。
当然,你也可以在 Criteria 查询中使用构造函数表达式。
long timeTx = 0;
long timeQuery = 0;
long iterations = 1000;
// Perform 1000 iterations
for (int i = 0; i < iterations; i++) {
EntityManager em = emf.createEntityManager();
long startTx = System.currentTimeMillis();
em.getTransaction().begin();
// Execute the query
long startQuery = System.currentTimeMillis();
List<BookValue> books = em.createQuery("SELECT new org.thoughts.on.java.model.BookValue(b.id, b.title) FROM Book b").getResultList();
long endQuery = System.currentTimeMillis();
timeQuery += endQuery - startQuery;
em.getTransaction().commit();
long endTx = System.currentTimeMillis();
em.close();
timeTx += endTx - startTx;
}
System.out.println("Transaction: total " + timeTx + " per iteration " + timeTx / (double)iterations);
System.out.println("Query: total " + timeQuery + " per iteration " + timeQuery / (double)iterations);
正如预期的那样,DTO 投影的性能比实体投影好得多
Transaction: total 1678 per iteration 1.678
Query: total 1143 per iteration 1.143
平均而言,执行查询需要 1.143 毫秒,执行事务需要 1.678 毫秒。对于查询来说,这是大约 43% 的性能改进,对于事务来说是大约 42% 的性能改进。
对于一个只需要一分钟就能实施的小变化来说,这还不错。
在大多数项目中,DTO 预测的性能改进将更高。它允许你检索用例所需的数据,而不仅仅是实体映射的所有属性。检索较少的数据几乎总是会带来更好的性能。
总结
选择正确的投影比想象的更容易、更重要。
当你想实现一个写操作时,你应该使用一个实体作为你的投影。Hibernate 将管理其状态,你只需在业务逻辑中更新其属性即可。Hibernate 会处理其余的事情。
你已经看到了我的小型性能测试的结果。我的笔记本电脑可能不是运行这些测试的最佳环境,而且它肯定比你的生产环境慢。但是性能改进是如此之大,以至于你应该使用哪种投影是显而易见的。
使用 DTO 投影的查询比检索实体的查询快约 40%。因此,最好花费额外的精力为只读操作创建 DTO,并将其用作投影。
还应该确保为所有关联使用使用 FetchType.LAZY
。正如在测试中所见,即使一个急切地(Eager)获取到一个关联,也可能使查询的执行时间增加两倍。因此,最好使用 FetchType.LAZY
并初始化用例所需的关联。