Bên dưới là bài viết của tác giả Roderick Bauer, đăng trên blog của nhà cung cấp dịch vụ sao lưu và lưu trữ đám mây Backblaze, được Cứu Dữ Liệu Trần Sang biên dịch sang tiếng Việt.
Khách hàng thường hỏi chúng tôi rằng có hay không và khi nào chúng tôi sẽ chuyển việc lưu trữ dữ liệu và sao lưu đám mây sang SSD (ổ đĩa thể rắn). Đó không phải là câu hỏi gây ngạc nhiên khi mà SSD có nhiều ưu điểm hơn so với ổ đĩa từ tính, còn được gọi là HDD (ổ cứng).
Chúng tôi có một lượng lớn người dùng HDD trong trung tâm dữ liệu (hiện có 100.000 ổ cứng lưu trữ trên 500 petabyte dữ liệu). Chúng tôi muốn cung cấp hiệu năng, độ tin cậy và giá thành tốt nhất cho dịch vụ lưu trữ và sao lưu đám mây, do đó chúng tôi không ngừng đánh giá ổ đĩa để đưa vào vận hành và trung tâm dữ liệu. Trong khi chúng tôi sử dụng SSD cho một số ứng dụng (sẽ được mô tả bên dưới), cũng có vài lý do giải thích tại sao HDD tiếp tục là lựa chọn chính của chúng tôi, cũng như các nhà cung cấp đám mây khác cho tương lai trước mắt.
HDD vs SSD
Cấu tạo bên trong của HDD 3.5" và SSD 2.5"
HDD: Platter - đĩa cứng (hay đĩa từ), Spindle - động cơ trục chính, R/W Head - đầu đọc/ghi (hay đầu từ), Actuator Arm - cánh tay truyền động, Actuator Axis - trục truyền động, Actuator - cơ cấu truyền động. HDD có khả năng chống sốc tối đa 55g (khi hoạt động), 350g (không hoạt động).
SSD: Cache - chip nhớ cache, Controller - chip điều khiển, NAND Flash memory - chip nhớ flash NAND. SSD có khả năng chống sốc lên đến 1.500g (cả khi hoạt động và không hoạt động).
Máy tính xách tay (laptop) mà tôi đang dùng để viết bài này có một ổ SSD 512GB, hiện nó trở thành chức năng thông dụng trên các dòng laptop cao cấp. Ưu điểm của SSD trên laptop rất dễ nhận thấy: chúng nhỏ hơn HDD, nhanh hơn, yên tĩnh hơn, bền hơn và không nhạy cảm với rung động, từ trường. Chúng cũng có độ trễ và thời gian truy cập thấp hơn nhiều.
Ngày nay, giá bán trực tuyến điển hình cho một SSD 2.5" 512GB dao động trong khoảng từ 140 đến 170 USD (3,2 đến 3,9 triệu đồng), trong khi HDD 3.5" 512GB chỉ từ 44 đến 65 USD (1 đến 1,5 triệu đồng). Đó là sự khác biệt đáng kể về giá, nhưng SSD giúp laptop nhẹ hơn, cho phép nó chống chọi tốt hơn với những cú sốc và va đập không thể tránh khỏi trong quá trình sử dụng hàng ngày, thêm vào đó là lợi ích khởi động (boot) máy hoặc thức dậy từ trạng thái ngủ nhanh hơn, mở ứng dụng và xử lý tập tin lớn cũng nhanh hơn, giá thành cao của SSD trong trường hợp này rất đáng giá.
Một số ưu điểm của SSD, nhất là tốc độ, được áp dụng vào máy tính để bàn. Vì thế, dòng máy tính này được trang bị ổ đĩa SSD ngày càng nhiều, chủ yếu dùng để chạy hệ điều hành, ứng dụng hoặc chứa dữ liệu được truy cập thường xuyên. Việc thay thế ổ đĩa boot bằng SSD trở thành một lựa chọn nâng cấp phổ biến để tạo nên sức sống mới cho máy tính, đặc biệt là với những máy khởi động ì ạch hoặc được sử dụng cho các ứng dụng nổi tiếng nạp chậm như Photoshop.
Trung tâm dữ liệu lại là một nơi khác biệt hoàn toàn. Mối quan tâm chính ở đây là độ tin cậy, mật độ lưu trữ và giá thành. SSD chiếm ưu thế ở hai tiêu chí đầu, nhưng với tiêu chí thứ ba, chúng chưa đủ sức cạnh tranh. Tại Backblaze, chúng tôi triển khai những HDD có mật độ cao hơn khi chúng có mặt trên thị trường - hiện nay chúng tôi đang dùng hai loại ổ đĩa 10TB và 12TB (cùng các dung lượng khác) trong trung tâm dữ liệu. Ổ đĩa dung lượng cao hơn cung cấp mật độ lưu trữ tốt hơn trên mỗi Storage Pod và Vault Pod, đồng thời làm giảm chi phí do ít đòi hỏi bảo trì và yêu cầu tổng công suất thấp hơn. Nếu so với SSD, trong cùng mật độ lưu trữ này sẽ tốn kém khoảng 1.000 USD trên mỗi terabyte, cao hơn đáng kể so với HDD. Nói một cách đơn giản, tầm giá của SSD chưa đủ thấp để có thể được dùng cho mục đích thương mại, mặc dù chúng mang lại nhiều lợi ích. Đây là lý do tại sao chúng tôi sử dụng HDD như là thiết bị lưu trữ chính cho tương lai trước mắt.
HDD là gì?
HDD ra đời cách đây hơn 60 năm, kể từ khi chúng được IBM giới thiệu vào năm 1956. Ổ đĩa đầu tiên này có kích cỡ của một chiếc ô tô, lưu trữ chỉ vỏn vẹn 3,75MB và có giá 300.000 USD tính theo đồng đô la ngày nay.
[Để tìm hiểu về quá trình ra đời và sự phát triển của bộ nhớ lưu trữ, vui lòng đọc bài viết Bộ nhớ lưu trữ giá 1 triệu USD giảm còn 2 cent cho mỗi gigabyte và Hành trình phát triển của bộ nhớ lưu trữ].
Hệ thống IBM 350 Disk Storage - dung lượng 3,75MB vào năm 1956.
IBM 350 Disk Storage là thành phần chính của hệ thống IBM 305 RAMAC (Random Access Method of Accounting and Control), được ra mắt vào tháng 9 năm 1956. Nó gồm có 40 đĩa và hai đầu đọc/ghi nằm trên một cánh tay đòn, có thể di chuyển lên xuống khối đĩa từ tính.
Cơ chế cơ bản của HDD vẫn không thay đổi kể từ đó, mặc dù nó đã trải qua rất nhiều cải tiến. HDD sử dụng từ tính để lưu dữ liệu lên một đĩa cứng quay. Đầu đọc/ghi được gắn vào một cánh tay đòn, nằm lơ lửng trên đĩa cứng để đọc và ghi dữ liệu. Đĩa cứng quay càng nhanh, HDD có hiệu năng càng cao. Những ổ đĩa laptop ngày nay quay ở tốc độ 5.400 hoặc 7.200 RPM (vòng/phút), trong khi một số đĩa cứng của HDD máy chủ thậm chí quay ở tốc độ cao hơn, lên đến 10.000 hoặc 15.000 RPM.
Bản vẽ cắt ngang của một ổ cứng.
Các đĩa cứng bên trong ổ đĩa được phủ một lớp phim nhạy cảm với từ tính, gồm nhiều hạt từ bé nhỏ. Dữ liệu được ghi khi một đầu ghi bay phía trên đĩa cứng quay; đầu ghi nhanh chóng đảo cực của một vùng chứa các hạt từ tính để cực từ của nó hướng lên hay hướng xuống, nhằm mã hóa thành mã nhị phân 1 hoặc 0. Nếu bạn nghĩ HDD có vẻ nhạy cảm với sốc và chấn động, bạn đã đúng. Chúng còn nhạy cảm với từ tính nữa, đây cũng là một cách để phá hủy dữ liệu trên HDD nếu bạn muốn vứt bỏ nó.
Ưu điểm lớn nhất của HDD là nó có thể lưu trữ nhiều dữ liệu với giá rất rẻ. Ổ cứng một và hai terabyte (tức bằng 1.024 và 2.048 gigabyte) không thông dụng cho laptop ngày nay, trong khi ổ 10TB và 12TB hiện đang dành cho máy tính để bàn và máy chủ (server). Mật độ và tốc độ quay liên tục được cải thiện. Tuy nhiên, nếu so sánh giá của các HDD và SSD phổ biến trên những gian hàng trực tuyến, bạn sẽ thấy SSD đắt gấp 3 đến 5 lần trên mỗi gigabyte. Do đó nếu bạn muốn lưu trữ nhiều và rẻ, sử dụng ổ cứng tiêu chuẩn chắc chắn sẽ là cách mang lại hiệu quả kinh tế hơn.
HDD được dùng tốt nhất trong trường hợp nào?
Mảng ổ đĩa (như máy chủ NAS, RAID...) - nơi đòi hỏi dung lượng lưu trữ lớn.
Máy tính để bàn, khi giá thành thấp là ưu tiên hàng đầu.
Lưu trữ dữ liệu truyền thông (hình ảnh, video, âm thanh hiện không dùng đến).
Ổ đĩa có hoạt động đọc và ghi rất nhiều.
[Để tìm hiểu về RAID, vui lòng đọc bài viết Giải thích các cấp độ RAID].
SSD là gì?
SSD cũng có lịch sử gần giống như HDD, thiết bị lưu trữ bán dẫn đầu tiên tương thích với giao tiếp ổ cứng được Storage Technology Corporation (StorageTek) giới thiệu vào năm 1978, mang tên STC 4305.
SSD STC 4305 - dung lượng 45MB thời điểm 1978.
STC 4305 là SSD nhắm vào thị trường tương thích với máy chủ lớn (mainframe) của IBM. Ổ đĩa này nhanh hơn gấp 7 lần so với hệ thống HDD IBM 2305 đang phổ biến lúc bấy giờ (và giá thành cũng chỉ bằng phân nửa). Nó gồm có một tủ chứa đầy thiết bị được tích điện kép và có giá 400.000 USD cho dung lượng 45MB, với tốc độ đọc đạt 1,5 MB/s.
Các SSD được sản xuất dựa trên một loại bộ nhớ bất biến, có tên gọi là NAND (tên của toán tử "NOT AND", một trong hai loại bộ nhớ flash chính). Bộ nhớ flash lưu trữ dữ liệu theo từng cell riêng biệt, được tạo bởi các transistor để hở cực cổng. Mặc dù là bộ nhớ bán dẫn, nhưng chúng vẫn có thể duy trì thông tin khi không được cấp nguồn - một tính năng cần thiết để cạnh tranh với bộ nhớ dựa trên đĩa cứng.
So với HDD, SSD cho tốc độ truyền dữ liệu cao hơn, mật độ lưu trữ cao hơn, độ tin cậy tốt hơn, độ trễ và thời gian truy cập thấp hơn nhiều. Với phần lớn người dùng, tốc độ của SSD thu hút họ là chính. Khi đề cập đến tốc độ của ổ đĩa, điều chúng ta muốn nói tới là tốc độ mà chúng có thể đọc và ghi dữ liệu.
SSD Samsung 850 Pro (mặt trước).
Với HDD, tốc độ đĩa cứng quay tác động lớn đến thời gian đọc/ghi. Khi dữ liệu trên HDD được truy cập, đầu đọc/ghi phải di chuyển đến vị trí mà dữ liệu đã được mã hóa trên một vùng từ tính của đĩa cứng. Nếu tập tin cần đọc đã được ghi tuần tự vào ổ đĩa, khi đó nó sẽ được đọc một cách nhanh chóng. Tuy nhiên, khi có nhiều dữ liệu được ghi không tuần tự vào ổ đĩa, khả năng các tập tin đó sẽ được ghi vào nhiều vùng, gây ra tình trạng phân mảnh dữ liệu. Khi dữ liệu bị phân mảnh, HDD mất nhiều thời gian hơn để đọc do đầu từ phải di chuyển đến nhiều vùng khác nhau trên (các) đĩa cứng để đọc hết tất cả dữ liệu theo yêu cầu.
Do SSD không có bộ phận chuyển động, nên chúng có thể hoạt động ở tốc độ cao hơn nhiều so với HDD thông thường. Phân mảnh cũng không phải là vấn đề với SSD. Các tập tin có thể được đọc/ghi ở bất kỳ vị trí nào và tác động rất nhỏ đến thời gian đọc/ghi, nhờ đó thời gian đọc nhanh hơn nhiều so với HDD, bất chấp tình trạng phân mảnh.
SSD Samsung 850 Pro (mặt sau).
Tuy nhiên, do cách thức dữ liệu được đọc và ghi vào ổ đĩa, cell SSD có thể bị hao mòn theo thời gian. Cell SSD đẩy các electron qua một cực cổng để thiết lập trạng thái cho nó. Quá trình này gây hao mòn trên mỗi cell và theo thời gian sẽ làm giảm hiệu năng của nó cho đến khi SSD bị hao mòn hết. Hiệu ứng này mất một thời gian dài và SSD đã có cơ chế giảm thiểu vấn đề này, chẳng hạn như lệnh TRIM. Bộ nhớ flash ghi toàn bộ khối lưu trữ bất chấp một vài trang bên trong khối đã được cập nhật. Điều này đòi hỏi hoạt động đọc và cache dữ liệu hiện có, tẩy xóa khối và ghi lại khối. Nếu một khối trống hiện diện, hoạt động ghi sẽ nhanh hơn rất nhiều. Lệnh TRIM - phải được hỗ trợ bởi cả hai hệ điều hành (HĐH) và SSD - cho phép HĐH thông báo với ổ đĩa rằng các khối nào không còn được sử dụng. Lệnh TRIM cho phép ổ đĩa tẩy xóa trước các khối để tạo nên khối trống sẵn có cho hoạt động ghi tiếp theo.
[Để hiểu rõ hơn về lệnh TRIM trong ổ SSD, vui lòng đọc bài viết Thu gom "rác" (garbage collection - GC) và lệnh TRIM trong ổ SSD].
Việc đọc và tẩy xóa lặp đi lặp lại trên SSD được tích lũy và ổ đĩa có thể chạy chậm lại, thậm chí dần dần hiển thị lỗi theo thời gian. Tuy nhiên, nhiều khả năng là hệ thống sử dụng SSD sẽ bị loại bỏ do lỗi thời trước khi SSD bắt đầu hiển thị lỗi đọc/ghi. Ổ cứng cũng dần bị hao mòn khi dùng liên tục, do chúng sử dụng các phương pháp ghi vật lý, vì thế phần lớn người dùng sẽ không dựa trên tuổi thọ dự kiến để lựa chọn HDD hoặc SSD.
Bo mạch của SSD Intel DC S3500.
Tóm lại, SSD được coi là bền hơn nhiều so với HDD do không có các bộ phận cơ khí. Cơ cấu chuyển động bên trong HDD dễ bị ảnh hưởng, không những gây hao mòn theo thời gian, mà còn bị hư hỏng do sự chuyển động và tiếp xúc mạnh. Nếu một người làm rơi laptop có chứa HDD bên trong, khả năng cao là những bộ phận chuyển động này sẽ va chạm nhau, dẫn đến nguy cơ mất dữ liệu, thậm chí gây hư hỏng vật lý khiến HDD chết ngay lập tức. SSD không có bộ phận chuyển động, mặc dù chúng có nguy cơ tuổi thọ ngắn hơn do tần suất sử dụng cao, nhưng chúng có thể sống sót trong những tình huống khắc nghiệt mà chúng ra gặp phải khi dùng laptop và các thiết bị di động.
SSD được dùng tốt nhất trong trường hợp nào?
Máy tính laptop, notebook yêu cầu về hiệu năng, nhẹ ký, mật độ lưu trữ, chống sốc và bền chắc.
Ổ đĩa boot có chứa HĐH và các ứng dụng, giúp tăng tốc độ boot và chạy ứng dụng.
Tập tin làm việc, chẳng hạn như dữ liệu truyền thông cần được chỉnh sửa: hình ảnh, video, âm thanh...
Hoán đổi ổ đĩa - nơi cần SSD để tăng tốc độ bộ nhớ ảo (page file) của ổ đĩa.
Ổ đĩa cache.
Máy chủ cơ sở dữ liệu.
Hồi sinh máy tính cũ. Nếu bạn sở hữu một máy tính mà nó có vẻ khởi động chậm, nạp ứng dụng và tập tin cũng chậm, hãy cập nhật ổ đĩa boot bằng một SSD để có thể tạo nên sự khác biệt, mặc dù không mới nhưng ít ra nó sẽ cải thiện hơn so với trước đây.
Theo dõi tiếp phần 2 - HDD vs SSD
Trong phần 2, chúng ta sẽ có cái nhìn sâu hơn về sự khác nhau giữa HDD và SSD, công nghệ phát triển của chúng, cũng như cách Backblaze tận dụng ưu điểm của SSD vào vận hành và trung tâm dữ liệu.