refactoring

fpavy · fpavy · commit 73e110d3c084 · 2025-01-08T17:50:44.000+01:00
diff --git a/crep/base.py b/crep/base.py
@@ -1438,8 +1438,8 @@ def segmentation_regular(
 
 
 def fill_segmentation(
-        df_segm: pd.DataFrame,
-        df_feat: pd.DataFrame,
+        df_segmentation: pd.DataFrame,
+        df_features: pd.DataFrame,
         id_discrete: list[str],
         id_continuous: list[str],
         dict_agg: dict[str, list[str]] | None = None
@@ -1449,9 +1449,9 @@ def fill_segmentation(
 
     Parameters
     ----------
-    df_segm: pd.DataFrame
+    df_segmentation: pd.DataFrame
         the dataframe containing the segmentation. Should contain only columns id_discrete and id_continuous
-    df_feat: pd.DataFrame
+    df_features: pd.DataFrame
         the dataframe containing the features to fit to the segmentation. Should contain the columns
         id_discrete and id_continuous as well as other columns for the features of interest.
     id_discrete
@@ -1465,14 +1465,14 @@ def fill_segmentation(
     """
     # verification of requirements
     for col in id_continuous + id_discrete:
-        if col not in df_segm.columns or col not in df_feat.columns:
+        if col not in df_segmentation.columns or col not in df_features.columns:
             raise Exception(f"Error: {col} is not present in both dataframes df_segm and df_feat.")
 
     is_df_segm_admissible = tools.admissible_dataframe(
-        data=df_segm, id_discrete=id_discrete, id_continuous=id_continuous
+        data=df_segmentation, id_discrete=id_discrete, id_continuous=id_continuous
     )
     is_df_feat_admissible = tools.admissible_dataframe(
-        data=df_feat, id_discrete=id_discrete, id_continuous=id_continuous
+        data=df_features, id_discrete=id_discrete, id_continuous=id_continuous
     )
     if not is_df_segm_admissible or not is_df_feat_admissible:
         raise Exception("Error: Both dataframes should be admissible:"
@@ -1481,9 +1481,9 @@ def fill_segmentation(
 
     # homogenize_between() reduces the difference in segment size between df_feat and df_segm. More precisely, it
     # adjusts df_feat to df_segm. This may reduce the risk of error when using merge().
-    df_segm, df_feat = homogenize_between(
-        df1=df_segm,
-        df2=df_feat,
+    df_segmentation, df_features = homogenize_between(
+        df1=df_segmentation,
+        df2=df_features,
         id_discrete=id_discrete,
         id_continuous=id_continuous,
         dict_agg_df1=None,
@@ -1492,13 +1492,13 @@ def fill_segmentation(
         verbose=False
     )
 
-    df_segm["__id__"] = 1
-    df_segm["__id__"] = df_segm["__id__"].cumsum()
+    df_segmentation["__id__"] = 1
+    df_segmentation["__id__"] = df_segmentation["__id__"].cumsum()
 
     # merging the segmentations in both df
     df_merge = merge(
-        data_left=df_segm,
-        data_right=df_feat,
+        data_left=df_segmentation,
+        data_right=df_features,
         id_continuous=id_continuous,
         id_discrete=id_discrete,
         how="left",
diff --git a/doc/requirements.txt b/doc/requirements.txt
@@ -7,5 +7,4 @@ nbsphinx
 sphinx-autoapi
 sphinx-version-warning
 sphinx-prompt
-numpydoc
-pandas
+numpydoc
diff --git a/test/conftest.py b/test/conftest.py
@@ -9,13 +9,13 @@
 
 @fixture(scope="module")
 def get_examples():
-    df_left = pd.read_csv("../data/base_left.csv")
-    df_right = pd.read_csv("../data/base_right.csv")
+    df_left = pd.read_csv("data/base_left.csv")
+    df_right = pd.read_csv("data/base_right.csv")
     return df_left, df_right
 
 
 @fixture(scope="module")
 def get_advanced_examples():
-    df_left = pd.read_csv("../data/advanced_left.csv")
-    df_right = pd.read_csv("../data/advanced_right.csv")
+    df_left = pd.read_csv("data/advanced_left.csv")
+    df_right = pd.read_csv("data/advanced_right.csv")
     return df_left, df_right
diff --git a/test/test_base.py b/test/test_base.py
@@ -849,8 +849,8 @@ def test_fill_segmentation():
                             "data2": [1, 0, 1, 1, 0, 1, 0, 0],
                             })
     df_test = fill_segmentation(
-        df_segm=df_segm,
-        df_feat=df_feat,
+        df_segmentation=df_segm,
+        df_features=df_feat,
         id_discrete=["discr1"],
         id_continuous=["cont1", "cont2"],
         dict_agg={"mean": ["data1"], "sum": ["data2"]}
diff --git a/test/test_tools.py b/test/test_tools.py
@@ -11,7 +11,7 @@
 
 id_discrete, id_continuous = ["id", "id2"], ["t1", "t2"]
 
-data = pd.read_csv("../examples/data/data_zones.csv")
+data = pd.read_csv("examples/data/data_zones.csv")
 
 
 def test_no_overlapping(get_examples):