Các nhà khoa học thuộc “Human Genome Project” đã và đang biên soạn một danh sách chuyên dụng về bộ gen của người (human genome). Catalogue này được người ta gọi là Bách Khoa Tự Điển về DNA (Encyclopedia of DNA Elements: ENCODE), còn được gọi là "gene" và người ta có thể xác định các tính trạng di truyền và bệnh tiềm ẩn mà thuật ngữ thông dụng gọi là "junk DNA."
Theo Sarah Djebali, trưởng nhóm dự án nghiên cứu này, ENCODE sẽ được sử dụng như một cơ sở cho ứng dụng trong y học và sinh học. ENCODE được bắt đầu từ năm 2003 với sự hợp tác của hơn 500 chuyên gia và nhiều phòng thí nghiệm trên thế giới và được sự đồng ý nhiều nhất vào năm nay. Một trong những phát hiện quan trọng của ENCODE là hơn 3/4 genome người có thể được sao chép từ DNA thành RNA, và không phải chỉ có 2% số ấy được người ta tin tưởng trước đây.