datacite · codycooperross · Feb 11, 2026 · Feb 10, 2026 · Feb 11, 2026
diff --git a/app/models/report.rb b/app/models/report.rb
@@ -24,11 +24,6 @@ def initialize(report, _options = {})
   end
 
   def self.parse_multi_subset_report(report)
-    subset = report.subsets.last
-
-    compressed = decode_report subset["gzip"]
-    json = decompress_report compressed
-    dataset_array = parse_subset json
     url = case true
           when Rails.env.production?
             "https://api.datacite.org/reports/#{report.report_id}"
@@ -37,11 +32,24 @@ def self.parse_multi_subset_report(report)
           else
             "https://api.stage.datacite.org/reports/#{report.report_id}"
           end
-    dataset_array.map do |dataset|
-      args = { header: report.header, url: url }
-      UsageUpdateParseJob.perform_later(dataset, args)
+
+    subsets = report.subsets
+    all_datasets = []
+
+    subsets.each do |subset|
+      compressed = decode_report subset["gzip"]
+      json = decompress_report compressed
+      dataset_array = parse_subset json
+
+      dataset_array.map do |dataset|
+        args = { header: report.header, url: url }
+        UsageUpdateParseJob.perform_later(dataset, args)
+      end
+
+      all_datasets.concat(dataset_array)
     end
-    dataset_array
+
+    all_datasets
   end
 
   def self.parse_normal_report(report)

diff --git a/...subset_report/when_report_is_ok/should_parse_and_return_all_datasets_from_all_subsets.yml b/...subset_report/when_report_is_ok/should_parse_and_return_all_datasets_from_all_subsets.yml
diff --git a/spec/models/report_spec.rb b/spec/models/report_spec.rb
@@ -7,33 +7,26 @@
   let(:url) do
     "https://api.stage.datacite.org/reports/9e5461d8-0713-4abd-8e87-e4533a76ab3d"
   end
-  # let(:url) {"https://api.stage.datacite.org/reports/82022fc3-8b31-47f2-88a8-24814d9bd2f0"}
 
-  # describe "parse_multi_subset_report" do
-  #   context "when report is ok" do
-  #     let(:body)  {File.read(fixture_path + 'multi_subset_report.json')}
-  #     let(:uncompressed)  {File.read(fixture_path + 'datacite_resolution_report_2018-09.json')}
-  #     let(:result) {OpenStruct.new(body: JSON.parse(body), url:"https://api.stage.datacite.org/reports/5cac6ca0-9391-4e1d-95cf-ba2f475cbfad")}
-  #     let(:report) {Report.new(result)}
-
-  #     it "should parsed it give you two arrays that are in every gzip" do
-  #       live_results = Maremma.get(url, host: "https://api.stage.datacite.org/")
-  #       report = Report.new(live_results)
+  describe "parse_multi_subset_report" do
+    context "when report is ok" do
+      it "should parse and return all datasets from all subsets" do
+        allow(UsageUpdateParseJob).to receive(:perform_later)
 
-  #       rr = Report.parse_multi_subset_report report
-  #       expect(rr).to be_a(Array)
-  #       expect(rr.size).to eq(408)
-  #       expect(rr.first.dig("performance")).to be_present
-  #     end
-  #   end
-  # end
+        response = UsageUpdate.get_data("https://api.datacite.org/reports/d0b2b372-1d0a-4aa6-8aad-a04673050cb2")
+        report = Report.new(response)
+        rr = Report.parse_multi_subset_report report
+
+        expect(rr).to be_a(Array)
+        expect(rr.size).to eq(57929)
+        expect(rr.first.dig("performance")).to be_present
+      end
+    end
+  end
 
   describe "parse_normal_report" do
     context "when report is ok" do
       let(:body)  { File.read("#{fixture_path}multi_subset_report.json") }
-      let(:uncompressed) do
-        File.read("#{fixture_path}datacite_resolution_report_2018-09.json")
-      end
       let(:result) do
         OpenStruct.new(body: JSON.parse(body),
                        url: "https://api.stage.datacite.org/reports/5cac6ca0-9391-4e1d-95cf-ba2f475cbfad")