[Recording oracle] Apply comments

Marishka17 · Marishka17 · commit a933ea6421cf · 2024-11-07T23:32:55.000+01:00
diff --git a/packages/examples/cvat/recording-oracle/alembic/versions/9d4367899f90_recreate_gt_stats.py b/packages/examples/cvat/recording-oracle/alembic/versions/9d4367899f90_recreate_gt_stats.py
@@ -25,13 +25,12 @@ def upgrade() -> None:
     op.create_table(
         "gt_stats",
         sa.Column("task_id", sa.String(), nullable=False),
-        sa.Column("cvat_task_id", sa.Integer(), nullable=False),
-        sa.Column("gt_frame_id", sa.Integer(), nullable=False),
+        sa.Column("gt_frame_name", sa.String(), nullable=False),
         sa.Column("failed_attempts", sa.Integer(), nullable=False),
         sa.Column("accepted_attempts", sa.Integer(), nullable=False),
         sa.Column("accumulated_quality", sa.Float(), nullable=False),
         sa.ForeignKeyConstraint(["task_id"], ["tasks.id"], ondelete="CASCADE"),
-        sa.PrimaryKeyConstraint("task_id", "gt_frame_id"),
+        sa.PrimaryKeyConstraint("task_id", "gt_frame_name"),
     )
     # ### end Alembic commands ###
 
diff --git a/packages/examples/cvat/recording-oracle/src/cvat/api_calls.py b/packages/examples/cvat/recording-oracle/src/cvat/api_calls.py
@@ -111,6 +111,19 @@ def get_quality_report_data(report_id: int) -> QualityReportData:
             raise
 
 
+def get_jobs_quality_reports(parent_id: int) -> list[models.QualityReport]:
+    logger = logging.getLogger("app")
+    with get_api_client() as api_client:
+        try:
+            return get_paginated_collection(
+                api_client.quality_api.list_reports_endpoint, parent_id=parent_id, target="job"
+            )
+
+        except exceptions.ApiException as e:
+            logger.exception(f"Exception when calling QualityApi.list_reports: {e}\n")
+            raise
+
+
 def get_task_validation_layout(task_id: int) -> models.TaskValidationLayoutRead:
     logger = logging.getLogger("app")
     with get_api_client() as api_client:
@@ -127,19 +140,6 @@ def get_task_validation_layout(task_id: int) -> models.TaskValidationLayoutRead:
             raise
 
 
-def get_jobs_quality_reports(parent_id: int) -> list[models.QualityReport]:
-    logger = logging.getLogger("app")
-    with get_api_client() as api_client:
-        try:
-            return get_paginated_collection(
-                api_client.quality_api.list_reports_endpoint, parent_id=parent_id, target="job"
-            )
-
-        except exceptions.ApiException as e:
-            logger.exception(f"Exception when calling QualityApi.list_reports: {e}\n")
-            raise
-
-
 def update_task_validation_layout(
     task_id: int,
     *,
@@ -168,3 +168,15 @@ def update_task_validation_layout(
 
         if logger.isEnabledFor(logging.DEBUG):
             logger.debug(f"Validation layout: {validation_layout}")
+
+
+def get_task_data_meta(task_id: int) -> models.DataMetaRead:
+    logger = logging.getLogger("app")
+    with get_api_client() as api_client:
+        try:
+            data_meta, _ = api_client.tasks_api.retrieve_data_meta(task_id)
+            return data_meta
+
+        except exceptions.ApiException as ex:
+            logger.exception(f"Exception when calling TaskApi.retrieve_data_meta: {ex}\n")
+            raise
diff --git a/packages/examples/cvat/recording-oracle/src/cvat/interface.py b/packages/examples/cvat/recording-oracle/src/cvat/interface.py
@@ -1,14 +1,14 @@
 from pydantic import BaseModel
 
 
-class AnnotationInfo(BaseModel):
+class _AnnotationInfo(BaseModel):
     accuracy: float | int
 
 
-class FrameResult(BaseModel):
+class _FrameResult(BaseModel):
     conflicts: list[dict]
-    annotations: AnnotationInfo
+    annotations: _AnnotationInfo
 
 
 class QualityReportData(BaseModel):
-    frame_results: dict[str, FrameResult]
+    frame_results: dict[str, _FrameResult]
diff --git a/packages/examples/cvat/recording-oracle/src/handlers/process_intermediate_results.py b/packages/examples/cvat/recording-oracle/src/handlers/process_intermediate_results.py
@@ -58,6 +58,7 @@
 
 _TaskIdToValidationLayout = dict[int, dict]
 _TaskIdToHoneypotsMapping = dict[int, dict]
+_TaskIdToSequenceOfFrameNames = dict[int, list[str]]
 
 _HoneypotFrameId = int
 _ValidationFrameId = int
@@ -72,6 +73,7 @@ class _ValidationResult:
     gt_stats: GtStats
     task_id_to_val_layout: _TaskIdToValidationLayout
     task_id_to_honeypots_mapping: _TaskIdToHoneypotsMapping
+    task_id_to_sequence_of_frame_names: _TaskIdToSequenceOfFrameNames
 
 
 T = TypeVar("T")
@@ -141,23 +143,33 @@ def _validate_jobs(self):
         task_id_to_val_layout: dict[int, cvat_api.models.TaskValidationLayoutRead] = {}
         task_id_to_honeypots_mapping: dict[int, _HoneypotFrameToValFrame] = {}
 
+        # store sequence of frame names for each task
+        # task honeypot with frame index matches the sequence[index]
+        task_id_to_sequence_of_frame_names: dict[int, list[str]] = {}
+
         min_quality = manifest.validation.min_quality
 
         job_id_to_quality_report: dict[int, cvat_api.models.QualityReport] = {}
 
         for cvat_task_id in cvat_task_ids:
+            # obtain quality report details
             task_quality_report = cvat_api.get_task_quality_report(cvat_task_id)
             task_quality_report_data = cvat_api.get_quality_report_data(task_quality_report.id)
             task_id_to_quality_report_data[cvat_task_id] = task_quality_report_data
 
+            # obtain task validation layout and define honeypots mapping
             task_val_layout = cvat_api.get_task_validation_layout(cvat_task_id)
             honeypot_frame_to_real = {
                 f: task_val_layout.honeypot_real_frames[idx]
                 for idx, f in enumerate(task_val_layout.honeypot_frames)
             }
             task_id_to_val_layout[cvat_task_id] = task_val_layout
             task_id_to_honeypots_mapping[cvat_task_id] = honeypot_frame_to_real
+            task_id_to_sequence_of_frame_names[cvat_task_id] = [
+                frame.name for frame in cvat_api.get_task_data_meta(cvat_task_id).frames
+            ]
 
+            # obtain quality reports for each job from the task
             job_id_to_quality_report.update(
                 {
                     quality_report.job_id: quality_report
@@ -172,28 +184,28 @@ def _validate_jobs(self):
 
             # assess quality of the job's honeypots
             task_quality_report_data = task_id_to_quality_report_data[cvat_task_id]
+            sorted_task_frame_names = task_id_to_sequence_of_frame_names[cvat_task_id]
             task_honeypots = {int(frame) for frame in task_quality_report_data.frame_results}
             honeypots_mapping = task_id_to_honeypots_mapping[cvat_task_id]
 
             for honeypot in task_honeypots & set(job_meta.job_frame_range):
                 val_frame = honeypots_mapping[honeypot]
+                val_frame_name = sorted_task_frame_names[val_frame]
 
                 result = task_quality_report_data.frame_results[str(honeypot)]
-                self._gt_stats.setdefault((cvat_task_id, val_frame), ValidationFrameStats())
-                self._gt_stats[
-                    (cvat_task_id, val_frame)
-                ].accumulated_quality += result.annotations.accuracy
+                self._gt_stats.setdefault(val_frame_name, ValidationFrameStats())
+                self._gt_stats[val_frame_name].accumulated_quality += result.annotations.accuracy
 
                 if result.annotations.accuracy < min_quality:
-                    self._gt_stats[(cvat_task_id, val_frame)].failed_attempts += 1
+                    self._gt_stats[val_frame_name].failed_attempts += 1
                 else:
-                    self._gt_stats[(cvat_task_id, val_frame)].accepted_attempts += 1
+                    self._gt_stats[val_frame_name].accepted_attempts += 1
 
             # assess job quality
             job_quality_report = job_id_to_quality_report[cvat_job_id]
 
             accuracy = job_quality_report.summary.accuracy
-            if isinstance(accuracy, int):
+            if not job_quality_report.summary.gt_count:
                 assert accuracy == 0
                 job_results[cvat_job_id] = self.UNKNOWN_QUALITY
                 rejected_jobs[cvat_job_id] = TooFewGtError
@@ -208,6 +220,7 @@ def _validate_jobs(self):
         self._rejected_jobs = rejected_jobs
         self._task_id_to_val_layout = task_id_to_val_layout
         self._task_id_to_honeypots_mapping = task_id_to_honeypots_mapping
+        self._task_id_to_sequence_of_frame_names = task_id_to_sequence_of_frame_names
 
     def _restore_original_image_paths(self, merged_dataset: dm.Dataset) -> dm.Dataset:
         class RemoveCommonPrefix(dm.ItemTransform):
@@ -320,6 +333,9 @@ def validate(self) -> _ValidationResult:
             gt_stats=self._require_field(self._gt_stats),
             task_id_to_val_layout=self._require_field(self._task_id_to_val_layout),
             task_id_to_honeypots_mapping=self._require_field(self._task_id_to_honeypots_mapping),
+            task_id_to_sequence_of_frame_names=self._require_field(
+                self._task_id_to_sequence_of_frame_names
+            ),
         )
 
 
@@ -359,7 +375,7 @@ def process_intermediate_results(  # noqa: PLR0912
         logger.debug("Task id %s, %s", getattr(task, "id", None), getattr(task, "__dict__", None))
 
     gt_stats = {
-        (gt_image_stat.cvat_task_id, gt_image_stat.gt_frame_id): ValidationFrameStats(
+        gt_image_stat.gt_frame_name: ValidationFrameStats(
             failed_attempts=gt_image_stat.failed_attempts,
             accepted_attempts=gt_image_stat.accepted_attempts,
             accumulated_quality=gt_image_stat.accumulated_quality,
@@ -391,9 +407,8 @@ def process_intermediate_results(  # noqa: PLR0912
 
     gt_stats = validation_result.gt_stats
     if gt_stats:
-        cvat_task_id_to_failed_val_frames: dict[
-            int, set[int]
-        ] = {}  # cvat_task_id: {val_frame_id, ...}
+        # cvat_task_id: {val_frame_id, ...}
+        cvat_task_id_to_failed_val_frames: dict[int, set[int]] = {}
         rejected_job_ids = rejected_jobs.keys()
 
         if rejected_job_ids:
@@ -411,9 +426,13 @@ def process_intermediate_results(  # noqa: PLR0912
                     for honeypot, val_frame in honeypots_mapping.items()
                     if honeypot in job_honeypots
                 ]
+                sorted_task_frame_names = validation_result.task_id_to_sequence_of_frame_names[
+                    cvat_task_id
+                ]
 
                 for val_frame in validation_frames:
-                    val_frame_stats = gt_stats[(cvat_task_id, val_frame)]
+                    val_frame_name = sorted_task_frame_names[val_frame]
+                    val_frame_stats = gt_stats[val_frame_name]
                     if (
                         val_frame_stats.failed_attempts >= Config.validation.gt_ban_threshold
                         and not val_frame_stats.accepted_attempts
@@ -439,9 +458,11 @@ def process_intermediate_results(  # noqa: PLR0912
             )
 
             updated_task_honeypot_real_frames = task_validation_layout.honeypot_real_frames.copy()
-            task_honeypot_real_frames_index = {
-                f: idx for idx, f in enumerate(updated_task_honeypot_real_frames)
-            }
+
+            # validation frames may be repeated
+            task_honeypot_real_frames_index: dict[int, list[int]] = {}
+            for idx, f in enumerate(updated_task_honeypot_real_frames):
+                task_honeypot_real_frames_index.setdefault(f, []).append(idx)
 
             rejected_jobs_for_task = [
                 j
@@ -478,7 +499,7 @@ def process_intermediate_results(  # noqa: PLR0912
                     for prev_val_frame, new_val_frame in zip(
                         validation_frames_to_replace, new_validation_frames, strict=True
                     ):
-                        idx = task_honeypot_real_frames_index[prev_val_frame]
+                        idx = task_honeypot_real_frames_index[prev_val_frame].pop(0)
                         updated_task_honeypot_real_frames[idx] = new_val_frame
                 except ValueError as ex:
                     logger.exception(
diff --git a/packages/examples/cvat/recording-oracle/src/models/validation.py b/packages/examples/cvat/recording-oracle/src/models/validation.py
@@ -57,8 +57,7 @@ class GtStats(Base):
     task_id = Column(
         String, ForeignKey("tasks.id", ondelete="CASCADE"), primary_key=True, nullable=False
     )
-    cvat_task_id = Column(Integer, nullable=False)
-    gt_frame_id = Column(Integer, primary_key=True, nullable=False)
+    gt_frame_name = Column(String, primary_key=True, nullable=False)
 
     failed_attempts = Column(Integer, default=0, nullable=False)
     accepted_attempts = Column(Integer, default=0, nullable=False)
diff --git a/packages/examples/cvat/recording-oracle/src/services/validation.py b/packages/examples/cvat/recording-oracle/src/services/validation.py
@@ -134,7 +134,7 @@ def get_task_gt_stats(
 
 
 def update_gt_stats(
-    session: Session, task_id: str, updated_gt_stats: dict[tuple[int, int], ValidationFrameStats]
+    session: Session, task_id: str, updated_gt_stats: dict[str, ValidationFrameStats]
 ):
     # Read more about upsert:
     # https://docs.sqlalchemy.org/en/20/orm/queryguide/dml.html#orm-upsert-statements
@@ -152,13 +152,12 @@ def update_gt_stats(
         [
             {
                 "task_id": task_id,
-                "cvat_task_id": cvat_task_id,
-                "gt_frame_id": gt_frame_id,
+                "gt_frame_name": gt_frame_name,
                 "failed_attempts": val_frame_stats.failed_attempts,
                 "accepted_attempts": val_frame_stats.accepted_attempts,
                 "accumulated_quality": val_frame_stats.accumulated_quality,
             }
-            for (cvat_task_id, gt_frame_id), val_frame_stats in updated_gt_stats.items()
+            for gt_frame_name, val_frame_stats in updated_gt_stats.items()
         ],
     )
     statement = statement.on_conflict_do_update(

Original file line number	Diff line number	Diff line change
`@@ -57,8 +57,7 @@ class GtStats(Base):`
`57`	`57`	`task_id = Column(`
`58`	`58`	`String, ForeignKey("tasks.id", ondelete="CASCADE"), primary_key=True, nullable=False`
`59`	`59`	`)`
`60`		`- cvat_task_id = Column(Integer, nullable=False)`
`61`		`- gt_frame_id = Column(Integer, primary_key=True, nullable=False)`
	`60`	`+ gt_frame_name = Column(String, primary_key=True, nullable=False)`
`62`	`61`
`63`	`62`	`failed_attempts = Column(Integer, default=0, nullable=False)`
`64`	`63`	`accepted_attempts = Column(Integer, default=0, nullable=False)`
Original file line number	Diff line number	Diff line change
`@@ -134,7 +134,7 @@ def get_task_gt_stats(`
`134`	`134`
`135`	`135`
`136`	`136`	`def update_gt_stats(`
`137`		`- session: Session, task_id: str, updated_gt_stats: dict[tuple[int, int], ValidationFrameStats]`
	`137`	`+ session: Session, task_id: str, updated_gt_stats: dict[str, ValidationFrameStats]`
`138`	`138`	`):`
`139`	`139`	`# Read more about upsert:`
`140`	`140`	`# https://docs.sqlalchemy.org/en/20/orm/queryguide/dml.html#orm-upsert-statements`
`@@ -152,13 +152,12 @@ def update_gt_stats(`
`152`	`152`	`[`
`153`	`153`	`{`
`154`	`154`	`"task_id": task_id,`
`155`		`- "cvat_task_id": cvat_task_id,`
`156`		`- "gt_frame_id": gt_frame_id,`
	`155`	`+ "gt_frame_name": gt_frame_name,`
`157`	`156`	`"failed_attempts": val_frame_stats.failed_attempts,`
`158`	`157`	`"accepted_attempts": val_frame_stats.accepted_attempts,`
`159`	`158`	`"accumulated_quality": val_frame_stats.accumulated_quality,`
`160`	`159`	`}`
`161`		`- for (cvat_task_id, gt_frame_id), val_frame_stats in updated_gt_stats.items()`
	`160`	`+ for gt_frame_name, val_frame_stats in updated_gt_stats.items()`
`162`	`161`	`],`
`163`	`162`	`)`
`164`	`163`	`statement = statement.on_conflict_do_update(`