Fix CPY due to cgraph change

wine99 · wine99 · commit 1dd723dc880f · 2025-07-17T13:43:33.000+08:00
diff --git a/ggml/src/ggml-openvino/openvino/op/cpy.cpp b/ggml/src/ggml-openvino/openvino/op/cpy.cpp
@@ -39,6 +39,11 @@ OutputVector translate_cpy(const NodeContext& context) {
 
     if (op_case == 1) {
         // Write K to cache_k
+        int64_t head_size = context.get_head_size();
+        int64_t num_heads_kv = context.get_num_heads_kv();
+        auto src0_reshape_shape =
+            ov::op::v0::Constant::create(ov::element::i64, {3}, std::vector<int64_t>{-1, num_heads_kv, head_size});
+        src0 = std::make_shared<ov::op::v1::Reshape>(src0, src0_reshape_shape, false);
         auto indices = context.get_input("update_indices_k");
         auto updated = std::make_shared<ov::op::v3::ScatterNDUpdate>(src1, indices, src0);
         res = std::make_shared<ov::op::v1::Reshape>(updated, std::make_shared<ov::op::v0::ShapeOf>(src1), false);
diff --git a/src/llama-graph.cpp b/src/llama-graph.cpp
@@ -1175,7 +1175,7 @@ static std::unique_ptr<llm_graph_input_attn_kv_unified> build_attn_inp_kv_unifie
         inp->self_v_idxs = mctx_cur->build_input_v_idxs(ctx0, ubatch);
 
         inp->self_kq_mask = ggml_new_tensor_4d(ctx0, GGML_TYPE_F32, n_kv, GGML_PAD(n_tokens/n_stream, GGML_KQ_MASK_PAD), 1, n_stream);
-        cb(inp->self_kq_mask, "KQ_mask", -1);
+        ggml_set_name(inp->self_kq_mask, "KQ_mask");
         ggml_set_input(inp->self_kq_mask);
 
         inp->self_kq_mask_cnv = cparams.flash_attn ? ggml_cast(ctx0, inp->self_kq_mask, GGML_TYPE_F16) : inp->self_kq_mask;